Как выполнить t-тест Уэлча в R


Критерий Стьюдента Уэлча используется для сравнения средних между двумя независимыми группами, когда не предполагается, что эти две группы имеют равные отклонения.

Чтобы выполнить t-критерий Уэлча в R, мы можем использовать функцию t.test() , которая использует следующий синтаксис:

t.test(x, y, альтернатива = c("двусторонний", "меньше", "больше"))

куда:

  • x: числовой вектор значений данных для первой группы.
  • y: числовой вектор значений данных для второй группы.
  • альтернатива: Альтернативная гипотеза теста. По умолчанию двусторонний.

В следующем примере показано, как использовать эту функцию для выполнения t-критерия Уэлча в R.

Пример: t-критерий Уэлча в R

Учитель хочет сравнить результаты экзаменов 12 учеников, которые использовали буклет для подготовки к экзамену, и 12 учеников, которые этого не сделали.

Следующие векторы показывают экзаменационные баллы для студентов в каждой группе:

booklet <- c(90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90)
no_booklet <- c(67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84)

Прежде чем мы выполним t-критерий Уэлча, мы можем сначала создать блок -диаграммы, чтобы визуализировать распределение баллов для каждой группы:

boxplot(booklet, no_booklet, names =c(" Booklet"," No Booklet "))

Мы можем ясно видеть, что группа «Буклет» имеет более высокий средний балл и более низкую дисперсию в баллах.

Чтобы формально проверить, существенно ли различаются средние баллы между группами, мы можем выполнить t-критерий Уэлча:

#perform Welch's t-test
t.test(booklet, no_booklet)

 Welch Two Sample t-test

data: booklet and no_booklet
t = 2.2361, df = 14.354, p-value = 0.04171
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.3048395 13.8618272
sample estimates:
mean of x mean of y 
 87.91667 80.83333

Из вывода мы видим, что тестовая статистика t равна 2,2361 , а соответствующее значение p равно 0,04171 .

Поскольку это p-значение меньше 0,05, мы можем отклонить нулевую гипотезу и заключить, что существует статистически значимая разница в средних результатах экзаменов между двумя группами.

Функция t.test() также предоставляет нам следующую информацию:

  • 95% доверительный интервал для разницы в средних баллах по экзаменам между двумя группами составляет [0,3048, 13,8618 ].
  • Средний экзаменационный балл первой группы – 87,91667 .
  • Средний экзаменационный балл второй группы – 80,83333 .

Вы можете найти полную документацию по функции t.test() здесь .

Дополнительные ресурсы

Как выполнить t-тест для парных выборок в R
Как построить несколько блочных диаграмм на одной диаграмме в R