Преобразование Бокса-Кокса — это широко используемый метод преобразования ненормально распределенного набора данных в более нормально распределенный .
Основная идея состоит в том, чтобы найти некоторое значение λ, чтобы преобразованные данные были как можно ближе к нормальному распределению, используя следующую формулу:
- y(λ) = (y λ – 1) / λ, если y ≠ 0
- y(λ) = log(y), если y = 0
В следующем пошаговом примере показано, как выполнить преобразование Бокса-Кокса для набора данных в Excel.
Шаг 1: введите данные
Во-первых, давайте введем значения для набора данных:

Шаг 2: Сортировка данных
Затем создайте столбец индекса и столбец отсортированных данных:

Шаг 3. Выберите произвольное значение для лямбда
Затем мы выберем произвольное значение 1 для лямбда и применим к данным временное преобразование бокса-кокса:

Шаг 4: Рассчитайте Z-показатели
Далее мы рассчитаем z-оценку для каждого значения в индексе:

Затем мы рассчитаем корреляцию между значениями, преобразованными по боксу-коксу, и z-показателями:

Шаг 5: Найдите оптимальное значение лямбда
Далее мы воспользуемся поиском цели, чтобы найти оптимальное значение лямбда для использования в преобразовании бокса-кокса.
Для этого щелкните вкладку « Данные » на верхней ленте. Затем нажмите «Анализ «что, если»» в группе « Прогноз ».

В раскрывающемся меню нажмите «Поиск цели » и введите следующие значения:

Как только вы нажмете OK , Goal Seek автоматически найдет оптимальное значение лямбда, равное -0,5225 .

Шаг 6: Выполните преобразование Бокса-Кокса
Наконец, мы применим преобразование бокса-кокса к исходным данным, используя лямбда-значение -0,5225:

Бонус: мы можем подтвердить нормальное распределение преобразованных данных, выполнив тест Харке-Бера в Excel .
Дополнительные ресурсы
Как преобразовать данные в Excel (логарифм, квадратный корень, кубический корень)
Как рассчитать Z-баллы в Excel