Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп.
Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
В этом руководстве объясняется, как выполнить тест Крускала-Уоллиса в R.
Пример: тест Крускала-Уоллиса в R
Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10 штук, применяя к каждой группе разные удобрения. В конце месяца измеряют высоту каждого растения.
Используйте следующие шаги, чтобы выполнить тест Крускала-Уоллиса, чтобы определить, одинаков ли медианный рост в трех группах.
Шаг 1: Введите данные.
Во-первых, мы создадим следующий фрейм данных, который содержит рост всех 30 растений вместе с их группой удобрений:
#create data frame
df <- data.frame(group=rep(c('A', 'B', 'C'), each= 10 ),
height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
6, 8, 8, 9, 5, 14, 13, 8, 10, 9))
#view first six rows of data frame
head(df)
group height
1 A 7
2 A 14
3 A 14
4 A 13
5 A 12
6 A 9
Шаг 2: Выполните тест Крускала-Уоллиса.
Далее мы выполним тест Крускала-Уоллиса, используя встроенную функцию kruskal.test() из базы R:
#perform Kruskal-Wallis Test
kruskal. test (height ~ group, data = df)
Kruskal-Wallis rank sum test
data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311
Шаг 3: Интерпретируйте результаты.
Тест Крускала-Уоллиса использует следующие нулевые и альтернативные гипотезы:
Нулевая гипотеза (H 0 ): Медиана одинакова для всех групп.
Альтернативная гипотеза: ( HA ): Медиана не одинакова для всех групп.
В этом случае тестовая статистика равна 6,2878 , а соответствующее значение p равно 0,0431 .
Поскольку это p-значение меньше 0,05, мы можем отвергнуть нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.
Это означает, что у нас есть достаточно доказательств, чтобы заключить, что тип используемого удобрения приводит к статистически значимым различиям в росте растений.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в R:
Как выполнить t-тест для парных выборок в R
Как выполнить односторонний ANOVA в R
Как выполнить дисперсионный анализ с повторными измерениями в R