Как выполнить тест Даннета в R

Как выполнить тест Даннета в R

Апостериорный тест — это тип теста, который выполняется после дисперсионного анализа , чтобы определить, какие средние значения групп статистически значимо отличаются друг от друга.

Если одна из групп в исследовании считается контрольной , то мы должны использовать критерий Даннета в качестве апостериорного критерия.

В этом руководстве объясняется, как выполнить тест Даннета в R.

Пример: тест Даннета в R

Предположим, учитель хочет узнать, могут ли два новых метода обучения повысить экзаменационные баллы его учеников. Чтобы проверить это, она случайным образом разделила свой класс из 30 учеников на следующие три группы:

  • Контрольная группа: 10 студентов
  • Новая методика обучения 1: 10 студентов
  • Новая методика обучения 2: 10 студентов

После одной недели использования назначенной им методики обучения каждый учащийся сдает один и тот же экзамен.

Мы можем использовать следующие шаги в R, чтобы создать набор данных, визуализировать средние значения группы, выполнить однофакторный дисперсионный анализ и, наконец, выполнить тест Даннета, чтобы определить, какой (если таковой имеется) новый метод обучения дает другие результаты по сравнению с контрольной группой.

Шаг 1: Создайте набор данных.

В следующем коде показано, как создать набор данных, содержащий результаты экзаменов для всех 30 учащихся:

#create data frame
data <- data.frame(technique = rep (c("control", "new1", "new2"), each = 10 ),
 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
 81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
 77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#view first six rows of data frame
head(data)

 technique score
1 control 76
2 control 77
3 control 77
4 control 81
5 control 82
6 control 82

Шаг 2: Визуализируйте результаты экзаменов для каждой группы.

В следующем коде показано, как создавать диаграммы для визуализации распределения баллов по экзаменам для каждой группы:

boxplot(score ~ technique,
 data = data,
 main = "Exam Scores by Studying Technique",
 xlab = "Studying Technique",
 ylab = "Exam Scores",
 col = "steelblue",
 border = "black")

Только из диаграмм мы можем видеть, что распределение экзаменационных баллов сильно различается для каждой методики обучения. Далее мы проведем однофакторный дисперсионный анализ, чтобы определить, являются ли эти различия статистически значимыми.

Связанный: Как построить несколько блочных диаграмм на одной диаграмме в R

Шаг 3: Выполните односторонний ANOVA.

В следующем коде показано, как выполнить однофакторный дисперсионный анализ для проверки различий между средними баллами за экзамен в каждой группе:

#fit the one-way ANOVA model
model <- aov(score ~ technique, data = data)

#view model output
summary(model)

 Df Sum Sq Mean Sq F value Pr(>F) 
technique 2 211.5 105.73 3.415 0.0476 \*
Residuals 27 836.0 30.96 
---
Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1

Поскольку общее p-значение ( 0,0476 ) меньше 0,05, это указывает на то, что у каждой группы разные средние баллы за экзамен. Затем мы выполним тест Даннета, чтобы определить, какая методика обучения дает средние экзаменационные баллы, отличные от контрольной группы.

Шаг 4: Проведите тест Даннета.

Чтобы выполнить тест Даннета в R, мы можем использовать функцию DunnettTest() из библиотеки DescTools , которая использует следующий синтаксис:

Тест Даннета (x, g)

куда:

  • x: числовой вектор значений данных (например, экзаменационные баллы).
  • g: вектор, определяющий имена групп (например, техника обучения)

Следующий код показывает, как использовать эту функцию для нашего примера:

#load DescTools library
library(DescTools)

#perform Dunnett's Test
DunnettTest(x=data$score, g=data$technique)

 Dunnett's test for comparing several treatments with a control : 
 95% family-wise confidence level

$control
 diff lwr.ci upr.ci pval 
new1-control 4.2 -1.6071876 10.00719 0.1787 
new2-control 6.4 0.5928124 12.20719 0.0296 \* 

---
Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1.' 0.1 ' ' 1

Способ интерпретации вывода следующий:

  • Средняя разница в экзаменационных баллах между новой методикой обучения 1 и контрольной группой составляет 4,2.Соответствующее значение р равно 0,1787 .
  • Средняя разница в экзаменационных баллах между новой методикой обучения 2 и контрольной группой составляет 6,4.Соответствующее значение р равно 0,0296 .

Основываясь на выводах, мы видим, что метод изучения 2 — единственный метод, который дает значительно (p = 0,0296) разные средние баллы за экзамен по сравнению с контрольной группой.

Дополнительные ресурсы

Введение в однофакторный дисперсионный анализ
Как провести односторонний дисперсионный анализ в R
Как выполнить тест Тьюки в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.