Как интерпретировать F-значение и P-значение в ANOVA

Как интерпретировать F-значение и P-значение в ANOVA

ANOVA («дисперсионный анализ») используется для определения того, равны ли средние значения трех или более независимых групп.

ANOVA использует следующие нулевые и альтернативные гипотезы:

  • H 0 : Все средние группы равны.
  • H A : По крайней мере одно среднее значение группы отличается от остальных.

Всякий раз, когда вы выполняете ANOVA, вы получите сводную таблицу, которая выглядит следующим образом:

| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | P-значение | | --- | --- | --- | --- | --- | --- | | Уход | 192,2 | 2 | 96,1 | 2,358 | 0,1138 | | Ошибка | 1100,6 | 27 | 40,8 |  |  | | Общий | 1292,8 | 29 |  |  |  |

Два значения, которые мы сразу анализируем в таблице, — это F-статистика и соответствующее p-значение .

Понимание F-статистики в ANOVA

F-статистика представляет собой отношение среднеквадратичной обработки к среднеквадратической ошибке:

  • F-статистика: обработка средних квадратов / ошибка средних квадратов

Другой способ написать это:

  • F-статистика: вариация между средними выборками / вариация внутри выборок

Чем больше F-статистика, тем больше вариация между выборочными средними по сравнению с вариациями внутри выборок.

Таким образом, чем больше F-статистика, тем больше доказательств того, что существует разница между средними группами.

Понимание P-значения в ANOVA

Чтобы определить, является ли разница между средними группами статистически значимой, мы можем посмотреть на p-значение , которое соответствует F-статистике.

Чтобы найти p-значение , соответствующее этому F-значению, мы можем использовать калькулятор F-распределения со степенями свободы в числителе = df Treatment и степенями свободы в знаменателе = df Error.

Например, p-значение, соответствующее F-значению 2,358, числителю df = 2 и знаменателю df = 27, равно 0,1138 .

Если это p-значение меньше α = 0,05, мы отвергаем нулевую гипотезу дисперсионного анализа и делаем вывод о наличии статистически значимой разницы между средними значениями трех групп.

В противном случае, если p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу и сделать вывод, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимое различие между средними значениями трех групп.

В этом конкретном примере p-значение равно 0,1138, поэтому мы не сможем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимая разница между средними группами.

Об использовании апостериорных тестов с дисперсионным анализом

Если p-значение ANOVA меньше 0,05, то мы отклоняем нулевую гипотезу о том, что среднее значение каждой группы равно.

В этом сценарии мы можем затем выполнить апостериорные тесты , чтобы точно определить, какие группы отличаются друг от друга.

Есть несколько потенциальных апостериорных тестов, которые мы можем использовать после ANOVA, но самые популярные из них включают:

  • Тест Тьюки
  • Тест Бонферрони
  • Тест Шеффе

Обратитесь к этому руководству , чтобы понять, какой апостериорный тест следует использовать в зависимости от вашей конкретной ситуации.

Дополнительные ресурсы

Следующие ресурсы предлагают дополнительную информацию о тестах ANOVA:

Введение в однофакторный дисперсионный анализ
Введение в двухфакторный дисперсионный анализ
Полное руководство: как сообщить о результатах ANOVA
ANOVA против регрессии: в чем разница?

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.