Как выполнить t-тест Уэлча в R

Как выполнить t-тест Уэлча в R

Критерий Стьюдента Уэлча используется для сравнения средних между двумя независимыми группами, когда не предполагается, что эти две группы имеют равные отклонения.

Чтобы выполнить t-критерий Уэлча в R, мы можем использовать функцию t.test() , которая использует следующий синтаксис:

t.test(x, y, альтернатива = c("двусторонний", "меньше", "больше"))

куда:

  • x: числовой вектор значений данных для первой группы.
  • y: числовой вектор значений данных для второй группы.
  • альтернатива: Альтернативная гипотеза теста. По умолчанию двусторонний.

В следующем примере показано, как использовать эту функцию для выполнения t-критерия Уэлча в R.

Пример: t-критерий Уэлча в R

Учитель хочет сравнить результаты экзаменов 12 учеников, которые использовали буклет для подготовки к экзамену, и 12 учеников, которые этого не сделали.

Следующие векторы показывают экзаменационные баллы для студентов в каждой группе:

booklet <- c(90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90)
no_booklet <- c(67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84)

Прежде чем мы выполним t-критерий Уэлча, мы можем сначала создать блок -диаграммы, чтобы визуализировать распределение баллов для каждой группы:

boxplot(booklet, no_booklet, names =c(" Booklet"," No Booklet "))
t-критерий Уэлча в R

Мы можем ясно видеть, что группа «Буклет» имеет более высокий средний балл и более низкую дисперсию в баллах.

Чтобы формально проверить, существенно ли различаются средние баллы между группами, мы можем выполнить t-критерий Уэлча:

#perform Welch's t-test
t.test(booklet, no_booklet)

 Welch Two Sample t-test

data: booklet and no_booklet
t = 2.2361, df = 14.354, p-value = 0.04171
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.3048395 13.8618272
sample estimates:
mean of x mean of y 
 87.91667 80.83333

Из вывода мы видим, что тестовая статистика t равна 2,2361 , а соответствующее значение p равно 0,04171 .

Поскольку это p-значение меньше 0,05, мы можем отклонить нулевую гипотезу и заключить, что существует статистически значимая разница в средних результатах экзаменов между двумя группами.

Функция t.test() также предоставляет нам следующую информацию:

  • 95% доверительный интервал для разницы в средних баллах по экзаменам между двумя группами составляет [0,3048, 13,8618 ].
  • Средний экзаменационный балл первой группы – 87,91667 .
  • Средний экзаменационный балл второй группы – 80,83333 .

Вы можете найти полную документацию по функции t.test() здесь .

Дополнительные ресурсы

Как выполнить t-тест для парных выборок в R
Как построить несколько блочных диаграмм на одной диаграмме в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.