F-тест против Т-теста: в чем разница?


Студенты часто путают два статистических теста: F-тест и Т-тест.В этом руководстве объясняется разница между двумя тестами.

F-тест: основы

F-тест используется для проверки равенства двух дисперсий совокупности. Нулевая и альтернативная гипотезы для теста следующие:

H 0 : σ 1 2 = σ 2 2 (дисперсии населения равны)

H 1 : σ 1 2 ≠ σ 2 2 (дисперсии совокупности не равны)

Статистика F-теста рассчитывается как s 1 2 / s 2 2 .

Если p-значение тестовой статистики меньше некоторого уровня значимости (обычно это 0,10, 0,05 и 0,01), нулевая гипотеза отклоняется.

Пример: F-тест для равных отклонений

Исследователь хочет знать, одинакова ли разница в высоте между двумя видами растений. Чтобы проверить это, она собирает случайную выборку из 20 растений из каждой популяции и вычисляет выборочную дисперсию для каждого образца.

Статистика F-теста оказывается равной 4,38712, а соответствующее значение p равно 0,0191. Поскольку это p-значение меньше 0,05, она отвергает нулевую гипотезу F-теста. Это означает, что у нее достаточно доказательств, чтобы сказать, что разница в высоте между двумя видами растений неодинакова .

Т-тест: основы

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.

Двухвыборочный t-критерий всегда использует следующую нулевую гипотезу:

  • H 0 : µ 1 = µ 2 (средние значения двух популяций равны)

Альтернативная гипотеза может быть двусторонней, левосторонней или правосторонней:

  • H 1 (двухсторонний): μ 1 ≠ μ 2 (средние значения двух популяций не равны)
  • H 1 (левосторонний): μ 1 < μ 2 (среднее значение для популяции 1 меньше среднего значения для популяции 2)
  • H 1 (правосторонний): μ 1 > μ 2 (среднее значение для популяции 1 больше, чем среднее для популяции 2)

Статистика теста рассчитывается как:

Статистика теста: ( x 1 - x 2 ) / s p (√ 1 / n 1 + 1 / n 2 )

где x 1 и x 2 — средние значения выборки, n 1 и n 2 — размеры выборки, и где s p рассчитывается как:

s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

где s 1 2 и s 2 2 — выборочные дисперсии.

Если p-значение, соответствующее тестовой статистике t с (n 1 +n 2 -1) степенями свободы, меньше выбранного вами уровня значимости (обычно это 0,10, 0,05 и 0,01), то вы можете отклонить нулевую гипотезу. .

Пример: двухвыборочный t-критерий

Исследователь хочет знать, равна ли средняя высота двух видов растений. Чтобы проверить это, она собирает случайную выборку из 20 растений из каждой популяции и вычисляет выборочное среднее для каждой выборки.

Статистика t-теста оказывается равной 1,251, а соответствующее значение p равно 0,2148. Поскольку это значение р не меньше 0,05, она не может отвергнуть нулевую гипотезу Т-теста. Это означает, что у нее нет достаточных доказательств того, что средняя высота этих двух видов растений различна.

F-тест против Т-теста: когда использовать каждый

Обычно мы используем F-тест , чтобы ответить на следующие вопросы:

  • Приходят ли две выборки из популяций с одинаковой дисперсией?
  • Снижает ли новое лечение или процесс изменчивость некоторых существующих методов лечения или процесса?

Обычно мы используем Т-тест , чтобы ответить на следующие вопросы:

  • Равны ли средние значения двух популяций? (Для ответа на этот вопрос мы используем двухвыборочный t-критерий )
  • Является ли среднее значение одной совокупности равным определенному значению? (Для ответа на этот вопрос мы используем одновыборочный t-критерий )

Дополнительные ресурсы

Введение в проверку гипотез
Калькулятор t-теста для одной выборки
Калькулятор t-критерия для двух выборок