Как выполнить тест Тьюки в R

Как выполнить тест Тьюки в R

Однофакторный дисперсионный анализ используется для определения того, существует ли статистически значимое различие между средними значениями трех или более независимых групп.

Если общее значение p из таблицы ANOVA меньше некоторого уровня значимости, то у нас есть достаточно доказательств, чтобы сказать, что по крайней мере одно из средних значений групп отличается от других.

Однако это не говорит нам, какие группы отличаются друг от друга. Это просто говорит нам, что не все средние группы равны. Чтобы выяснить, какие именно группы отличаются друг от друга, мы должны провестиапостериорный тест .

Одним из наиболее часто используемых апостериорных тестов является тест Тьюки , который позволяет нам проводить попарные сравнения между средними значениями каждой группы, при этом контролируя частоту ошибок по семействам .

В этом руководстве объясняется, как выполнить тест Тьюки в R.

Примечание. Если одна из групп в вашем исследовании считается контрольной, вам следует вместо этого использовать критерий Даннета в качестве апостериорного теста.

Пример: тест Тьюки в R

Шаг 1: Соответствуйте модели ANOVA.

В следующем коде показано, как создать поддельный набор данных с тремя группами (A, B и C) и подогнать к данным однофакторную модель ANOVA, чтобы определить, равны ли средние значения для каждой группы:

#make this example reproducible
set.seed(0)

#create data
data <- data.frame(group = rep (c("A", "B", "C"), each = 30),
 values = c(runif(30, 0, 3),
 runif(30, 0, 5),
 runif(30, 1, 7)))

#view first six rows of data
head(data)

 group values
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

#fit one-way ANOVA model
model <- aov (values~group, data=data)

#view the model output
summary(model)

 Df Sum Sq Mean Sq F value Pr(>F) 
group 2 98.93 49.46 30.83 7.55e-11 \*\*\*
Residuals 87 139.57 1.60 
---
Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1

Мы видим, что общее значение p из таблицы ANOVA составляет 7,55e-11.Поскольку это меньше 0,05, у нас есть достаточно доказательств, чтобы сказать, что средние значения по каждой группе не равны. Таким образом, мы можем приступить к выполнению теста Тьюки, чтобы точно определить, какие средние значения групп различаются.

Шаг 2: Проведите тест Тьюки.

В следующем коде показано, как использовать функцию TukeyHSD() для выполнения теста Тьюки:

#perform Tukey's Test
TukeyHSD(model, conf.level= .95 ) 

 Tukey multiple comparisons of means
 95% family-wise confidence level

Fit: aov(formula = values ~ group, data = data)

$group
 diff lwr upr p adj
B-A 0.9777414 0.1979466 1.757536 0.0100545
C-A 2.5454024 1.7656076 3.325197 0.0000000
C-B 1.5676610 0.7878662 2.347456 0.0000199

Значение р указывает, есть ли статистически значимая разница между каждой программой. Из результатов видно, что существует статистически значимая разница между средней потерей веса по каждой программе на уровне значимости 0,05.

Особенно:

  • P-значение для разницы средних между B и A: 0,0100545
  • P-значение для разницы в средних значениях между C и A: 0,0000000
  • P-значение для разницы средних между C и B: 0,0000199

Шаг 3: Визуализируйте результаты.

Мы также можем использовать функцию plot(TukeyHSD()) для визуализации доверительных интервалов:

#plot confidence intervals
plot(TukeyHSD(model, conf.level= .95 ), las = 2 )

Примечание. Аргумент las указывает, что метки делений должны быть перпендикулярны (las=2) к оси.

Тест Тьюки в R

Мы видим, что ни один из доверительных интервалов для среднего значения между группами не содержит нулевое значение, что указывает на наличие статистически значимой разницы в средних потерях между всеми тремя группами. Это согласуется с тем фактом, что все p-значения из наших тестов гипотез ниже 0,05.

Для этого конкретного примера мы можем сделать следующие выводы:

  • Средние значения группы С значительно выше, чем средние значения обеих групп А и В.
  • Средние значения группы В значительно выше, чем средние значения группы А.

Дополнительные ресурсы

Руководство по использованию апостериорных тестов с ANOVA
Как провести односторонний дисперсионный анализ в R
Как провести двухсторонний ANOVA в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.