Как интерпретировать F-значение и P-значение в ANOVA


ANOVA («дисперсионный анализ») используется для определения того, равны ли средние значения трех или более независимых групп.

ANOVA использует следующие нулевые и альтернативные гипотезы:

  • H 0 : Все средние группы равны.
  • H A : По крайней мере одно среднее значение группы отличается от остальных.

Всякий раз, когда вы выполняете ANOVA, вы получите сводную таблицу, которая выглядит следующим образом:

| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | P-значение | | --- | --- | --- | --- | --- | --- | | Уход | 192,2 | 2 | 96,1 | 2,358 | 0,1138 | | Ошибка | 1100,6 | 27 | 40,8 |  |  | | Общий | 1292,8 | 29 |  |  |  |

Два значения, которые мы сразу анализируем в таблице, — это F-статистика и соответствующее p-значение .

Понимание F-статистики в ANOVA

F-статистика представляет собой отношение среднеквадратичной обработки к среднеквадратической ошибке:

  • F-статистика: обработка средних квадратов / ошибка средних квадратов

Другой способ написать это:

  • F-статистика: вариация между средними выборками / вариация внутри выборок

Чем больше F-статистика, тем больше вариация между выборочными средними по сравнению с вариациями внутри выборок.

Таким образом, чем больше F-статистика, тем больше доказательств того, что существует разница между средними группами.

Понимание P-значения в ANOVA

Чтобы определить, является ли разница между средними группами статистически значимой, мы можем посмотреть на p-значение , которое соответствует F-статистике.

Чтобы найти p-значение , соответствующее этому F-значению, мы можем использовать калькулятор F-распределения со степенями свободы в числителе = df Treatment и степенями свободы в знаменателе = df Error.

Например, p-значение, соответствующее F-значению 2,358, числителю df = 2 и знаменателю df = 27, равно 0,1138 .

Если это p-значение меньше α = 0,05, мы отвергаем нулевую гипотезу дисперсионного анализа и делаем вывод о наличии статистически значимой разницы между средними значениями трех групп.

В противном случае, если p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу и сделать вывод, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимое различие между средними значениями трех групп.

В этом конкретном примере p-значение равно 0,1138, поэтому мы не сможем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимая разница между средними группами.

Об использовании апостериорных тестов с дисперсионным анализом

Если p-значение ANOVA меньше 0,05, то мы отклоняем нулевую гипотезу о том, что среднее значение каждой группы равно.

В этом сценарии мы можем затем выполнить апостериорные тесты , чтобы точно определить, какие группы отличаются друг от друга.

Есть несколько потенциальных апостериорных тестов, которые мы можем использовать после ANOVA, но самые популярные из них включают:

  • Тест Тьюки
  • Тест Бонферрони
  • Тест Шеффе

Обратитесь к этому руководству , чтобы понять, какой апостериорный тест следует использовать в зависимости от вашей конкретной ситуации.

Дополнительные ресурсы

Следующие ресурсы предлагают дополнительную информацию о тестах ANOVA:

Введение в однофакторный дисперсионный анализ
Введение в двухфакторный дисперсионный анализ
Полное руководство: как сообщить о результатах ANOVA
ANOVA против регрессии: в чем разница?