Как определить равную или неравную дисперсию в t-тестах

Как определить равную или неравную дисперсию в t-тестах

Когда мы хотим сравнить средства двух независимых групп, мы можем выбирать между двумя разными тестами:

Критерий Стьюдента: предполагается, что обе группы данных взяты из совокупностей, которые следуют нормальному распределению и что обе совокупности имеют одинаковую дисперсию.

Критерий Стьюдента Уэлча: предполагается, что обе группы данных взяты из совокупностей, которые следуют нормальному распределению, но не предполагает, что эти две совокупности имеют одинаковую дисперсию .

Таким образом, если две выборки не имеют одинаковой дисперсии, лучше всего использовать t-критерий Уэлча.

Но как определить, что две выборки имеют одинаковую дисперсию?

Есть два способа сделать это:

1. Используйте эмпирическое правило дисперсии.

Как правило, если отношение большей дисперсии к меньшей дисперсии меньше 4, мы можем предположить, что дисперсии примерно равны, и использовать t-критерий Стьюдента.

Например, предположим, что у нас есть следующие два образца:

Выборка 1 имеет дисперсию 24,86, а выборка 2 — 15,76.

Отношение большей дисперсии выборки к меньшей дисперсии выборки будет рассчитываться как:

Отношение = 24,86 / 15,76 = 1,577

Поскольку это отношение меньше 4, можно предположить, что дисперсии между двумя группами примерно равны.

Таким образом, мы могли бы приступить к выполнению критерия Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.

2. Выполните F-тест.

F-тест — это формальный статистический тест, в котором используются следующие нулевая и альтернативные гипотезы:

H 0 : Образцы имеют равные отклонения.

H A : Образцы не имеют одинаковой дисперсии.

Статистика теста рассчитывается следующим образом:

F = с 1 2 / с 2 2

где s 1 2 и s 2 2 — выборочные дисперсии.

Если p-значение, соответствующее тестовой статистике, меньше некоторого уровня значимости (например, 0,05), то у нас есть достаточно доказательств, чтобы сказать, что выборки не имеют одинаковой дисперсии.

Еще раз предположим, что у нас есть следующие два образца:

Чтобы выполнить F-тест для этих двух выборок, мы можем рассчитать статистику F-теста как:

  • F = с 1 2 / с 2 2
  • F = 24,86/15,76
  • F = 1,577

Согласно Калькулятору F-распределения , F-значение 1,577 с числителем df = n 1 -1 = 12 и знаменателем df = n 2 -1 = 12 имеет соответствующее p-значение 0,22079.

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Другими словами, мы можем предположить, что выборочные дисперсии равны.

Таким образом, мы могли бы приступить к выполнению критерия Стьюдента, чтобы определить, имеют ли две группы одинаковое среднее значение.

Дополнительные ресурсы

Если вы решите выполнить t-критерий Стьюдента, вы можете использовать следующие руководства в качестве справочных материалов:

И если вы решите выполнить t-критерий Уэлча, вы можете использовать следующие учебные пособия в качестве справочных материалов:

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.