Фактор Байеса: определение + интерпретация

Когда мы проводим проверку гипотезы , мы обычно получаем p-значение, которое мы сравниваем с некоторым альфа-уровнем, чтобы решить, должны ли мы отклонить или не отклонить нулевую гипотезу.

Например, мы можем провести t-тест для двух выборок, используя альфа-уровень 0,05, чтобы определить, равны ли два средних значения совокупности. Предположим, мы проводим тест и получаем p-значение 0,0023. В этом случае мы бы отклонили нулевую гипотезу о том, что два средних значения совокупности равны, поскольку значение p меньше выбранного нами уровня альфа.

P-значения — это распространенная метрика, используемая для отклонения или неспособности отвергнуть какую-либо гипотезу, но есть и другая метрика, которую также можно использовать: коэффициент Байеса .

Фактор Байеса определяется как отношение вероятности одной конкретной гипотезы к вероятности другой гипотезы. Обычно он используется для нахождения отношения вероятности альтернативной гипотезы к нулевой гипотезе:

Коэффициент Байеса = вероятность данных H A / вероятность данных H 0

Например, если коэффициент Байеса равен 5, то это означает, что альтернативная гипотеза в 5 раз более вероятна, чем нулевая гипотеза с учетом данных.

И наоборот, если коэффициент Байеса равен 1/5, это означает, что нулевая гипотеза в 5 раз более вероятна, чем альтернативная гипотеза с учетом данных.

Подобно p-значениям, мы можем использовать пороговые значения, чтобы решить, когда следует отклонить нулевую гипотезу. Например, мы можем решить, что коэффициент Байеса, равный 10 или выше, является достаточно убедительным доказательством, чтобы отвергнуть нулевую гипотезу.

Ли и Вагенмейкер предложили следующие интерпретации байесовского фактора в статье 2015 года :

| Фактор Байеса | Интерпретация | | --- | --- | | > 100 | Крайние доказательства альтернативной гипотезы | | 30 – 100 | Очень убедительные доказательства альтернативной гипотезы | | 10 – 30 | Сильные доказательства альтернативной гипотезы | | 3 – 10 | Умеренные доказательства альтернативной гипотезы | | 1 – 3 | Неподтвержденные доказательства альтернативной гипотезы | | 1 | Нет доказательств | | 1/3 – 1 | Неподтвержденные доказательства нулевой гипотезы | | 1/3 – 1/10 | Умеренные доказательства нулевой гипотезы | | 1/10 – 1/30 | Сильные доказательства нулевой гипотезы | | 1/30 – 1/100 | Очень сильное доказательство нулевой гипотезы | | < 1/100 | Экстремальные доказательства нулевой гипотезы |

Фактор Байеса против P-значений

Фактор Байеса и p-значения имеют разные интерпретации.

P-значения:

Значение p интерпретируется как вероятность получения результатов, столь же экстремальных, как наблюдаемые результаты проверки гипотезы, при условии, что нулевая гипотеза верна.

Например, предположим, что вы проводите двухвыборочный t-критерий, чтобы определить, равны ли два средних значения генеральной совокупности. Если тест дает p-значение 0,0023, это означает, что вероятность получения этого результата составляет всего 0,0023 , если два средних значения совокупности фактически равны. Поскольку это значение очень мало, мы отклоняем нулевую гипотезу и заключаем, что у нас есть достаточно доказательств, чтобы сказать, что средние значения двух совокупностей не равны.

Фактор Байеса:

Фактор Байеса интерпретируется как отношение вероятности появления наблюдаемых данных при альтернативной гипотезе к вероятности появления наблюдаемых данных при нулевой гипотезе.

Например, предположим, что вы проводите проверку гипотезы и получаете коэффициент Байеса, равный 4. Это означает, что альтернативная гипотеза в 4 раза более вероятна, чем нулевая гипотеза, учитывая данные, которые вы фактически наблюдали.

Вывод

Некоторые статистики считают, что фактор Байеса имеет преимущество перед p-значениями, поскольку позволяет количественно оценить доказательства за и против двух конкурирующих гипотез. Например, доказательства можно количественно оценить в пользу или против нулевой гипотезы, что невозможно сделать с помощью p-значения.

Независимо от того, какой подход вы используете — фактор Байеса или p-значения — вам все равно придется выбрать пороговое значение, если вы хотите отклонить или не отклонить какую-то нулевую гипотезу.

Например, в приведенной выше таблице мы видели, что коэффициент Байеса, равный 9, будет классифицироваться как «умеренное свидетельство в пользу альтернативной гипотезы», а коэффициент Байеса, равный 10, будет классифицирован как «сильное свидетельство в пользу альтернативной гипотезы».

В этом смысле фактор Байеса страдает от той же проблемы, что и значение p, равное 0,06, считается «незначимым», в то время как значение p, равное 0,05, может считаться значимым.

Дальнейшее чтение:

Объяснение P-значений и статистической значимости
Простое объяснение статистической и практической значимости

Фактор Байеса: определение + интерпретация

Фактор Байеса против P-значений

Вывод

Редакция Кодкампа