Как определить равную или неравную дисперсию в t-тестах


Когда мы хотим сравнить средства двух независимых групп, мы можем выбирать между двумя разными тестами:

Критерий Стьюдента: предполагается, что обе группы данных взяты из совокупностей, которые следуют нормальному распределению и что обе совокупности имеют одинаковую дисперсию.

Критерий Стьюдента Уэлча: предполагается, что обе группы данных взяты из совокупностей, которые следуют нормальному распределению, но не предполагает, что эти две совокупности имеют одинаковую дисперсию .

Таким образом, если две выборки не имеют одинаковой дисперсии, лучше всего использовать t-критерий Уэлча.

Но как определить, что две выборки имеют одинаковую дисперсию?

Есть два способа сделать это:

1. Используйте эмпирическое правило дисперсии.

Как правило, если отношение большей дисперсии к меньшей дисперсии меньше 4, мы можем предположить, что дисперсии примерно равны, и использовать t-критерий Стьюдента.

Например, предположим, что у нас есть следующие два образца:

Выборка 1 имеет дисперсию 24,86, а выборка 2 — 15,76.

Отношение большей дисперсии выборки к меньшей дисперсии выборки будет рассчитываться как:

Отношение = 24,86 / 15,76 = 1,577

Поскольку это отношение меньше 4, можно предположить, что дисперсии между двумя группами примерно равны.

Таким образом, мы могли бы приступить к выполнению критерия Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.

2. Выполните F-тест.

F-тест — это формальный статистический тест, в котором используются следующие нулевая и альтернативные гипотезы:

H 0 : Образцы имеют равные отклонения.

H A : Образцы не имеют одинаковой дисперсии.

Статистика теста рассчитывается следующим образом:

F = с 1 2 / с 2 2

где s 1 2 и s 2 2 — выборочные дисперсии.

Если p-значение, соответствующее тестовой статистике, меньше некоторого уровня значимости (например, 0,05), то у нас есть достаточно доказательств, чтобы сказать, что выборки не имеют одинаковой дисперсии.

Еще раз предположим, что у нас есть следующие два образца:

Чтобы выполнить F-тест для этих двух выборок, мы можем рассчитать статистику F-теста как:

  • F = с 1 2 / с 2 2
  • F = 24,86/15,76
  • F = 1,577

Согласно Калькулятору F-распределения , F-значение 1,577 с числителем df = n 1 -1 = 12 и знаменателем df = n 2 -1 = 12 имеет соответствующее p-значение 0,22079.

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Другими словами, мы можем предположить, что выборочные дисперсии равны.

Таким образом, мы могли бы приступить к выполнению критерия Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.

Дополнительные ресурсы

Если вы решите выполнить t-критерий Стьюдента, вы можете использовать следующие руководства в качестве справочных материалов:

И если вы решите выполнить t-критерий Уэлча, вы можете использовать следующие учебные пособия в качестве справочных материалов: