Приближение Саттертуэйта: определение и пример

Приближение Саттертуэйта: определение и пример

Приближение Саттертуэйта — это формула, используемая для нахождения «эффективных степеней свободы» в двухвыборочном t-тесте.

Он чаще всего используется в t-тесте Уэлча , который сравнивает средние значения двух независимых выборок, не предполагая, что совокупности, из которых взяты выборки , имеют одинаковую дисперсию.

Формула приближения Саттертуэйта выглядит следующим образом:

Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}

куда:

  • s 1 2 , s 2 2 : выборочная дисперсия первой и второй выборки соответственно.
  • n 1 , n 2 : Размер первой и второй выборки соответственно.

В следующем примере показано, как использовать приближение Саттертуэйта для вычисления эффективных степеней свободы.

Пример: Расчет приближения Саттертуэйта

Предположим, мы хотим знать, равна ли средняя высота двух разных видов растений, поэтому мы собираем две простые случайные выборки каждого вида и измеряем высоту растений в каждой выборке.

Следующие значения показывают высоту (в дюймах) для каждого образца:

Образец 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Образец 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Средние значения, дисперсии и размеры выборки оказываются следующими:

  • х 1 = 19,27
  • х 2 = 23,69
  • с 1 2 = 20,42
  • с 2 2 = 83,23
  • п 1 = 11
  • п 2 =13

Затем мы можем подставить значения дисперсий и размеров выборки в формулу приближения Саттертуэйта, чтобы найти эффективные степени свободы:

df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]} 

df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137

Эффективных степеней свободы оказывается 18,137 .

Обычно мы округляем это значение в меньшую сторону до ближайшего целого числа, поэтому степени свободы, которые мы будем использовать в нашем t-тесте Уэлча, равны 18 .

Наконец, будет найдено критическое значение t в таблице t-распределения, которое соответствует двустороннему критерию с альфа = 0,05 для 18 степеней свободы:

Таблица распределения T

Критическое значение t равно 2,101 .

Затем мы рассчитали бы нашу тестовую статистику следующим образом:

Статистика теста: ( x 1 – x 2 ) / (√ s 1 2 / n 1 + s 2 2 / n 2 )

Статистика теста: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Поскольку абсолютное значение нашей тестовой статистики (1,538) не превышает критического значения t, мы не можем отвергнуть нулевую гипотезу теста.

Нет достаточных доказательств, чтобы сказать, что средства двух популяций значительно различаются.

Приближение Саттертуэйта на практике

На практике вам редко придется вычислять приближение Саттертуэйта вручную.

Вместо этого обычное статистическое программное обеспечение, такое как R, Python, Excel, SAS и Stata, может использовать приближение Саттертуэйта для автоматического расчета эффективных степеней свободы.

Дополнительные ресурсы

Введение в проверку гипотез
Введение в двухвыборочный t-критерий
Введение в t-критерий Уэлча

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.