Полное руководство: проверка гипотез в R


Тест гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не отвергнуть некоторую статистическую гипотезу.

В этом руководстве объясняется, как выполнить следующие проверки гипотез в R:

  • Один образец t-критерия
  • Два выборочных t-теста
  • Парные выборки t-критерий

Мы можем использовать функцию t.test() в R для выполнения каждого типа теста:

#one sample t-test
t. test (x, y = NULL,
 alternative = c(" two.sided", " less", " greater "),
 mu = 0, paired = FALSE, var.equal = FALSE ,
 conf.level = 0.95, …)

куда:

В следующих примерах показано, как использовать эту функцию на практике.

Пример 1: один выборочный t-критерий в R

Одновыборочный t-критерий используется для проверки того, равно ли среднее значение совокупности некоторому значению.

Например, предположим, что мы хотим узнать, равен ли средний вес определенного вида какой-либо черепахи 310 фунтам. Мы выходим и собираем простую случайную выборку черепах со следующими весами:

Вес : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

В следующем коде показано, как выполнить этот пример t-теста в R:

#define vector of turtle weights
turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)

#perform one sample t-test
t. test (x = turtle_weights, mu = 310)

 One Sample t-test

data: turtle_weights
t = -1.5848, df = 12, p-value = 0.139
alternative hypothesis: true mean is not equal to 310
95 percent confidence interval:
 303.4236 311.0379
sample estimates:
mean of x 
 307.2308 

Из вывода мы видим:

  • Статистика t-теста: -1,5848
  • степеней свободы: 12
  • р-значение: 0,139
  • 95% доверительный интервал для истинного среднего: [303,4236, 311,0379]
  • средний вес черепахи: 307,230

Поскольку p-значение теста (0,139) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств того, что средний вес этого вида черепах отличается от 310 фунтов.

Пример 2: двухвыборочный t-критерий в R

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.

Например, предположим, что мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы собираем простую случайную выборку черепах каждого вида со следующими весами:

Образец 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Образец 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305.

В следующем коде показано, как выполнить эти два примера t-теста в R:

#define vector of turtle weights for each sample
sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)
sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305)

#perform two sample t-test
t. test (x = sample1, y = sample2)

 Welch Two Sample t-test

data: sample1 and sample2
t = -2.1009, df = 19.112, p-value = 0.04914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.73862953 -0.03060124
sample estimates:
mean of x mean of y 
 307.2308 314.6154 

Из вывода мы видим:

  • Статистика t-теста: -2,1009
  • степеней свободы: 19.112
  • p-значение: 0,04914
  • 95% доверительный интервал для истинной разности средних: [-14,74, -0,03]
  • среднее значение весов образца 1: 307,2308
  • среднее значение весов выборки 2: 314,6154

Поскольку p-значение теста (0,04914) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средний вес между двумя видами не равен.

Пример 3: t-критерий парных выборок в R

Стьюдентный критерий для парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть сопоставлено с наблюдением в другой выборке.

Например, предположим, что мы хотим узнать, способна ли определенная тренировочная программа увеличить максимальный вертикальный прыжок (в дюймах) баскетболистов.

Чтобы проверить это, мы можем набрать простую случайную выборку из 12 баскетболистов колледжа и измерить каждый из их максимальных вертикальных прыжков. Затем мы можем попросить каждого игрока использовать тренировочную программу в течение одного месяца, а затем снова измерить их максимальный вертикальный прыжок в конце месяца.

Следующие данные показывают максимальную высоту прыжка (в дюймах) до и после использования тренировочной программы для каждого игрока:

До : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

После : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

В следующем коде показано, как выполнить этот t-тест для парных выборок в R:

#define before and after max jump heights
before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21)
after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20)

#perform paired samples t-test
t. test (x = before, y = after, paired = TRUE )

 Paired t-test

data: before and after
t = -2.5289, df = 11, p-value = 0.02803
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3379151 -0.1620849
sample estimates:
mean of the differences 
 -1.25

Из вывода мы видим:

  • Статистика t-теста: -2,5289
  • степеней свободы: 11
  • р-значение: 0,02803
  • 95% доверительный интервал для истинной разности средних: [-2,34, -0,16]
  • средняя разница между до и после: -1,25

Поскольку p-значение теста (0,02803) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средняя высота прыжка до и после использования тренировочной программы не одинакова.

Дополнительные ресурсы

Используйте следующие онлайн-калькуляторы для автоматического выполнения различных t-тестов:

Калькулятор t-теста для одной выборки
Калькулятор t-критерия для двух выборок
Калькулятор t-критерия для парных выборок

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.