У студентов, изучающих статистику, часто возникает вопрос:
Можно ли выполнить однофакторный дисперсионный анализ, если размеры выборки в каждой группе не равны?
Краткий ответ:
Да, вы можете выполнить однофакторный дисперсионный анализ, если размеры выборки не равны. Равные размеры выборки не являются одним из допущений , сделанных в ANOVA.
Однако есть две потенциальные проблемы, о которых следует помнить при выполнении однофакторного дисперсионного анализа с неравными размерами выборки:
(1) Уменьшенная статистическая мощность.
(2) Пониженная устойчивость к неравной дисперсии.
В следующих разделах подробно объясняются обе эти потенциальные проблемы.
Проблема № 1: снижение статистической мощности
Когда мы используем любой тип статистического теста для сравнения групп, статистическая мощность теста максимальна, когда каждая группа имеет одинаковый размер выборки.
Напомним, что статистическая мощность относится к вероятности того, что тест обнаружит некоторый эффект, когда он действительно есть.
Можно показать, что чем больше разница в размерах выборки между группами, тем ниже статистическая мощность дисперсионного анализа.
Вот почему исследователям обычно нужны образцы одинакового размера, чтобы они имели более высокую мощность и, следовательно, большую вероятность обнаружения истинных различий.
Конечно, можно выполнить однофакторный дисперсионный анализ с неравными размерами выборки, но вы должны знать, что мощность однофакторного дисперсионного анализа будет снижена.
Проблема № 2: Надежность снижена до неравной дисперсии
Одно из предположений одностороннего дисперсионного анализа состоит в том, что дисперсия между каждой группой одинакова.
В целом, однофакторный дисперсионный анализ считается устойчивым к нарушениям предположения о равных дисперсиях, но только в том случае, если каждая группа имеет одинаковый размер выборки .
Таким образом, если у вас неравные размеры выборки и неравные дисперсии между группами, то результатам однофакторного дисперсионного анализа трудно доверять.
Как принять решение об использовании однофакторного дисперсионного анализа с неравными размерами выборки
Если у вас неравные размеры выборки и вы хотите выполнить однофакторный дисперсионный анализ для проверки различий между средними группами, вы можете использовать следующую блок-схему, чтобы решить, как действовать дальше:
Вот краткое объяснение блок-схемы:
Шаг 1: Определите, имеет ли каждая группа одинаковую дисперсию.
Чтобы определить, имеет ли каждая группа одинаковую дисперсию, вы можете использовать один из двух подходов:
- Создайте диаграммы для каждой группы и посмотрите, примерно ли разброс значений в каждой группе одинаков.
- Выполните формальный статистический тест на равные отклонения, например , тест Бартлетта .
Если дисперсии не равны, выполните критерий Крускала-Уоллиса , который считается непараметрическим эквивалентом однофакторного дисперсионного анализа.
Если дисперсии равны, переходим к следующему шагу.
Шаг 2: Определите, нормально ли распределена каждая группа.
Чтобы определить, являются ли значения в каждой группе примерно нормально распределенными, вы можете использовать один из двух подходов:
- Создайте гистограммы или графики QQ для каждой группы.
- Выполните формальные статистические тесты, такие как Шапиро-Уилк, Колмогоров-Смиронов, Жарк-Барре или Д'Агостино-Пирсон.
Если каждая группа распределена нормально, вы можете приступить к однофакторному дисперсионному анализу и интерпретировать результаты так же, как и при обычном однофакторном дисперсионном анализе.
Если каждая группа не распределена нормально, вместо этого выполните тест Крускала-Уоллиса.
Дополнительные ресурсы
Введение в однофакторный дисперсионный анализ
Как проверить предположения ANOVA
Введение в тест Крускала-Уоллиса
Как интерпретировать F-значение и P-значение в ANOVA