Поправка Бонферрони: определение и пример


Всякий раз, когда вы выполняете проверку гипотезы , всегда есть шанс совершить ошибку первого рода. Это когда вы отвергаете нулевую гипотезу, когда она на самом деле верна.

Иногда мы называем это «ложноположительным» — когда мы утверждаем, что есть статистически значимый эффект, но на самом деле его нет.

Когда мы проводим проверку одной гипотезы, частота ошибок типа I равна уровню значимости (α), который обычно выбирается равным 0,01, 0,05 или 0,10. Однако, когда мы проводим сразу несколько проверок гипотез, вероятность получения ложного срабатывания возрастает.

Когда мы проводим несколько проверок гипотез одновременно, нам приходится иметь дело с чем -то, известным как коэффициент ошибок для всей семьи , который представляет собой вероятность того, что по крайней мере один из тестов даст ложноположительный результат. Это можно рассчитать как:

Семейная частота ошибок = 1 – (1-α) n

куда:

  • α: уровень значимости для проверки одной гипотезы.
  • n: общее количество тестов

Если мы проведем только одну проверку гипотезы, используя α = 0,05, вероятность того, что мы совершим ошибку первого рода, составит всего 0,05.

Частота семейных ошибок = 1 – (1-α) c = 1 – (1-0,05) 1 = 0,05

Если мы проведем сразу две проверки гипотез и будем использовать α = 0,05 для каждой проверки, вероятность того, что мы совершим ошибку I рода, возрастет до 0,0975.

Частота семейных ошибок = 1 – (1-α) c = 1 – (1-0,05) 2 = 0,0975

А если мы проведем сразу пять проверок гипотез, используя для каждой проверки α = 0,05, вероятность того, что мы совершим ошибку I рода, возрастет до 0,2262.

Частота семейных ошибок = 1 – (1-α) c = 1 – (1-0,05) 5 = 0,2262

Легко видеть, что по мере увеличения количества статистических тестов вероятность совершения ошибки первого рода хотя бы в одном из тестов быстро возрастает.

Один из способов справиться с этим — использовать поправку Бонферрони.

Что такое поправка Бонферрони?

Поправка Бонферрони относится к процессу корректировки уровня альфа (α) для семейства статистических тестов таким образом, чтобы мы контролировали вероятность совершения ошибки I рода.

Формула поправки Бонферрони выглядит следующим образом:

α новый = α исходный / n

куда:

  • α original : исходный уровень α
  • n: общее количество выполненных сравнений или тестов.

Например, если мы выполняем сразу три статистических теста и хотим использовать α = 0,05 для каждого теста, поправка Бонферрони говорит нам, что мы должны использовать α new = 0,01667 .

α новый = α исходный / n = 0,05 / 3 = 0,01667

Таким образом, мы должны отклонять нулевую гипотезу каждого отдельного теста, только если p-значение теста меньше 0,01667.

Поправка Бонферрони: пример

Предположим, профессор хочет знать, приводят ли студенты к разным экзаменационным баллам при использовании трех различных методов обучения.

Чтобы проверить это, она случайным образом поручает 30 ученикам использовать каждый метод обучения. После одной недели использования назначенной им методики обучения каждый учащийся сдает один и тот же экзамен.

Затем она выполняет однофакторный дисперсионный анализ и обнаруживает, что общее значение p равно 0,0476.Поскольку это значение меньше 0,05, она отклоняет нулевую гипотезу однофакторного дисперсионного анализа и заключает, что не каждый метод обучения дает одинаковый средний балл за экзамен.

Чтобы выяснить, какие методы обучения дают статистически значимые результаты, она выполняет следующие парные t-тесты:

  • Техника 1 против Техники 2
  • Техника 1 против Техники 3
  • Техника 2 против Техники 3

Она хочет контролировать вероятность совершения ошибки первого рода при α = 0,05. Поскольку она выполняет несколько тестов одновременно, она решает применить поправку Бонферрони и использовать α new = 0,01667 .

α новый = α исходный / n = 0,05 / 3 = 0,01667

Затем она приступает к выполнению t-тестов для каждой группы и находит следующее:

  • Техника 1 против Техники 2 | р-значение = 0,0463
  • Техника 1 против Техники 3 | p-значение = 0,3785
  • Техника 2 против Техники 3 | р-значение = 0,0114

Поскольку p-значение для Метода 2 по сравнению с Методом 3 является единственным p-значением меньше 0,01667, она заключает, что существует только статистически значимое различие между методом 2 и методом 3.

Дополнительные ресурсы

Калькулятор коррекции Бонферрони
Как выполнить поправку Бонферрони в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.