Двухвыборочный t-критерий: определение, формула и пример


Двухвыборочный t-критерий используется для определения того, равны ли две средние значения генеральной совокупности .

В этом руководстве объясняется следующее:

  • Мотивация для выполнения двухвыборочного t-теста.
  • Формула для выполнения двухвыборочного t-критерия.
  • Предположения, которые должны быть соблюдены для выполнения двухвыборочного t-критерия.
  • Пример выполнения двухвыборочного t-теста.

Два выборочных t-теста: Мотивация

Предположим, мы хотим узнать, равен ли средний вес черепах двух разных видов. Поскольку в каждой популяции тысячи черепах, было бы слишком долго и дорого ходить и взвешивать каждую отдельную черепаху.

Вместо этого мы могли бы взять простую случайную выборку из 15 черепах из каждой популяции и использовать средний вес в каждой выборке, чтобы определить, равен ли средний вес между двумя популяциями:

Однако практически гарантируется, что средний вес между двумя выборками будет хотя бы немного отличаться. Вопрос в том, является ли эта разница статистически значимой.К счастью, t-критерий с двумя выборками позволяет нам ответить на этот вопрос.

Два выборочных t-критерия: формула

Двухвыборочный t-критерий всегда использует следующую нулевую гипотезу:

  • H 0 : µ 1 = µ 2 (средние значения двух популяций равны)

Альтернативная гипотеза может быть двусторонней, левосторонней или правосторонней:

  • H 1 (двухсторонний): μ 1 ≠ μ 2 (средние значения двух популяций не равны)
  • H 1 (левосторонний): μ 1 < μ 2 (среднее значение для популяции 1 меньше среднего значения для популяции 2)
  • H 1 (правосторонний): μ 1 > μ 2 (среднее значение для популяции 1 больше, чем среднее для популяции 2)

Мы используем следующую формулу для расчета тестовой статистики t:

Статистика теста: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )

где x 1 и x 2 — средние значения выборки, n 1 и n 2 — размеры выборки, и где s p рассчитывается как:

s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

где s 1 2 и s 2 2 — выборочные дисперсии.

Если p-значение, соответствующее тестовой статистике t с (n 1 +n 2 -1) степенями свободы, меньше выбранного вами уровня значимости (обычно это 0,10, 0,05 и 0,01), то вы можете отклонить нулевую гипотезу. .

Двухвыборочный t-критерий: предположения

Чтобы результаты двухвыборочного t-критерия были достоверными, должны выполняться следующие допущения:

  • Наблюдения в одной выборке не должны зависеть от наблюдений в другой выборке.
  • Данные должны быть приблизительно нормально распределены.
  • Две выборки должны иметь примерно одинаковую дисперсию. Если это предположение не выполняется, вместо этого следует выполнить t-критерий Уэлча .
  • Данные в обеих выборках были получены методом случайной выборки .

Два выборочных t-теста : Пример

Предположим, мы хотим узнать, равен ли средний вес черепах двух разных видов. Чтобы проверить это, выполним t-критерий с двумя выборками на уровне значимости α = 0,05, используя следующие шаги:

Шаг 1: Соберите образцы данных.

Предположим, мы собираем случайную выборку черепах из каждой популяции со следующей информацией:

Образец 1:

  • Объем выборки n 1 = 40
  • Средний вес выборки x 1 = 300
  • Стандартное отклонение выборки s 1 = 18,5

Образец 2:

  • Объем выборки n 2 = 38
  • Средний вес выборки x 2 = 305
  • Стандартное отклонение выборки s 2 = 16,7

Шаг 2: Определите гипотезы.

Мы проведем двухвыборочный t-тест со следующими гипотезами:

  • H 0 : µ 1 = µ 2 (средние значения двух популяций равны)
  • H 1 : μ 1 ≠ μ 2 (средние значения двух популяций не равны)

Шаг 3: Рассчитайте тестовую статистику t .

Во-первых, мы рассчитаем объединенное стандартное отклонение s p :

s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ (40-1)18,5 2 + (38-1)16,7 2 / (40+38-2) = 17,647

Далее мы рассчитаем тестовую статистику t :

t = ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647 (√ 1/40 + 1/38 ) = -1,2508

Шаг 4: Рассчитайте p-значение тестовой статистики t .

Согласно калькулятору T Score to P Value , p-значение, связанное с t = -1,2508 и степенями свободы = n 1 +n 2 -2 = 40 + 38-2 = 76, составляет 0,21484 .

Шаг 5: Сделайте вывод.

Поскольку это p-значение не меньше нашего уровня значимости α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что средний вес черепах между этими двумя популяциями различен.

Примечание. Вы также можете выполнить весь этот t-критерий для двух выборок, просто воспользовавшись Калькулятором t-критерия для двух выборок.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить двухвыборочный t-критерий с использованием различных статистических программ:

Как выполнить t-тест с двумя выборками в Excel
Как выполнить t-критерий с двумя выборками в SPSS
Как выполнить двухвыборочный t-тест в Stata
Как выполнить t-тест с двумя выборками в Python
Как выполнить двухвыборочный t-критерий на калькуляторе TI-84