ANOVA («дисперсионный анализ») используется для определения того, равны ли средние значения трех или более независимых групп.
ANOVA использует следующие нулевые и альтернативные гипотезы:
- H 0 : Все средние группы равны.
- H A : По крайней мере одно среднее значение группы отличается от остальных.
Всякий раз, когда вы выполняете ANOVA, вы получите сводную таблицу, которая выглядит следующим образом:
| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | P-значение | | --- | --- | --- | --- | --- | --- | | Уход | 192,2 | 2 | 96,1 | 2,358 | 0,1138 | | Ошибка | 1100,6 | 27 | 40,8 | | | | Общий | 1292,8 | 29 | | | |
Два значения, которые мы сразу анализируем в таблице, — это F-статистика и соответствующее p-значение .
Понимание F-статистики в ANOVA
F-статистика представляет собой отношение среднеквадратичной обработки к среднеквадратической ошибке:
- F-статистика: обработка средних квадратов / ошибка средних квадратов
Другой способ написать это:
- F-статистика: вариация между средними выборками / вариация внутри выборок
Чем больше F-статистика, тем больше вариация между выборочными средними по сравнению с вариациями внутри выборок.
Таким образом, чем больше F-статистика, тем больше доказательств того, что существует разница между средними группами.
Понимание P-значения в ANOVA
Чтобы определить, является ли разница между средними группами статистически значимой, мы можем посмотреть на p-значение , которое соответствует F-статистике.
Чтобы найти p-значение , соответствующее этому F-значению, мы можем использовать калькулятор F-распределения со степенями свободы в числителе = df Treatment и степенями свободы в знаменателе = df Error.
Например, p-значение, соответствующее F-значению 2,358, числителю df = 2 и знаменателю df = 27, равно 0,1138 .
Если это p-значение меньше α = 0,05, мы отвергаем нулевую гипотезу дисперсионного анализа и делаем вывод о наличии статистически значимой разницы между средними значениями трех групп.
В противном случае, если p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу и сделать вывод, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимое различие между средними значениями трех групп.
В этом конкретном примере p-значение равно 0,1138, поэтому мы не сможем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимая разница между средними группами.
Об использовании апостериорных тестов с дисперсионным анализом
Если p-значение ANOVA меньше 0,05, то мы отклоняем нулевую гипотезу о том, что среднее значение каждой группы равно.
В этом сценарии мы можем затем выполнить апостериорные тесты , чтобы точно определить, какие группы отличаются друг от друга.
Есть несколько потенциальных апостериорных тестов, которые мы можем использовать после ANOVA, но самые популярные из них включают:
- Тест Тьюки
- Тест Бонферрони
- Тест Шеффе
Обратитесь к этому руководству , чтобы понять, какой апостериорный тест следует использовать в зависимости от вашей конкретной ситуации.
Дополнительные ресурсы
Следующие ресурсы предлагают дополнительную информацию о тестах ANOVA:
Введение в однофакторный дисперсионный анализ
Введение в двухфакторный дисперсионный анализ
Полное руководство: как сообщить о результатах ANOVA
ANOVA против регрессии: в чем разница?