Как выполнить тест Крускала-Уоллиса в R


Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп.

Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

В этом руководстве объясняется, как выполнить тест Крускала-Уоллиса в R.

Пример: тест Крускала-Уоллиса в R

Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10 штук, применяя к каждой группе разные удобрения. В конце месяца измеряют высоту каждого растения.

Используйте следующие шаги, чтобы выполнить тест Крускала-Уоллиса, чтобы определить, одинаков ли медианный рост в трех группах.

Шаг 1: Введите данные.

Во-первых, мы создадим следующий фрейм данных, который содержит рост всех 30 растений вместе с их группой удобрений:

#create data frame
df <- data.frame(group=rep(c('A', 'B', 'C'), each= 10 ),
 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
 15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
 6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

 group height
1 A 7
2 A 14
3 A 14
4 A 13
5 A 12
6 A 9

Шаг 2: Выполните тест Крускала-Уоллиса.

Далее мы выполним тест Крускала-Уоллиса, используя встроенную функцию kruskal.test() из базы R:

#perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

 Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Шаг 3: Интерпретируйте результаты.

Тест Крускала-Уоллиса использует следующие нулевые и альтернативные гипотезы:

Нулевая гипотеза (H 0 ): Медиана одинакова для всех групп.

Альтернативная гипотеза: ( HA ): Медиана не одинакова для всех групп.

В этом случае тестовая статистика равна 6,2878 , а соответствующее значение p равно 0,0431 .

Поскольку это p-значение меньше 0,05, мы можем отвергнуть нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.

Это означает, что у нас есть достаточно доказательств, чтобы заключить, что тип используемого удобрения приводит к статистически значимым различиям в росте растений.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в R:

Как выполнить t-тест для парных выборок в R
Как выполнить односторонний ANOVA в R
Как выполнить дисперсионный анализ с повторными измерениями в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.