Преобразование Бокса-Кокса в Excel (шаг за шагом)


Преобразование Бокса-Кокса — это широко используемый метод преобразования ненормально распределенного набора данных в более нормально распределенный .

Основная идея состоит в том, чтобы найти некоторое значение λ, чтобы преобразованные данные были как можно ближе к нормальному распределению, используя следующую формулу:

  • y(λ) = (y λ – 1) / λ, если y ≠ 0
  • y(λ) = log(y), если y = 0

В следующем пошаговом примере показано, как выполнить преобразование Бокса-Кокса для набора данных в Excel.

Шаг 1: введите данные

Во-первых, давайте введем значения для набора данных:

Шаг 2: Сортировка данных

Затем создайте столбец индекса и столбец отсортированных данных:

Шаг 3. Выберите произвольное значение для лямбда

Затем мы выберем произвольное значение 1 для лямбда и применим к данным временное преобразование бокса-кокса:

Шаг 4: Рассчитайте Z-показатели

Далее мы рассчитаем z-оценку для каждого значения в индексе:

Затем мы рассчитаем корреляцию между значениями, преобразованными по боксу-коксу, и z-показателями:

Шаг 5: Найдите оптимальное значение лямбда

Далее мы воспользуемся поиском цели, чтобы найти оптимальное значение лямбда для использования в преобразовании бокса-кокса.

Для этого щелкните вкладку « Данные » на верхней ленте. Затем нажмите «Анализ «что, если»» в группе « Прогноз ».

В раскрывающемся меню нажмите «Поиск цели » и введите следующие значения:

Как только вы нажмете OK , Goal Seek автоматически найдет оптимальное значение лямбда, равное -0,5225 .

Шаг 6: Выполните преобразование Бокса-Кокса

Наконец, мы применим преобразование бокса-кокса к исходным данным, используя лямбда-значение -0,5225:

Бонус: мы можем подтвердить нормальное распределение преобразованных данных, выполнив тест Харке-Бера в Excel .

Дополнительные ресурсы

Как преобразовать данные в Excel (логарифм, квадратный корень, кубический корень)
Как рассчитать Z-баллы в Excel