Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп.
Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
В этом руководстве представлен пошаговый пример проведения теста Крускала-Уоллиса в SAS.
Шаг 1: введите данные
Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений.
Они случайным образом выбирают 30 разных растений и делят их на три группы по 10 штук, применяя к каждой группе разные удобрения. В конце месяца измеряют высоту каждого растения.
Мы введем следующие данные в SAS, которые показывают общий рост (в дюймах) для каждого из 10 растений в каждой группе:
/\*create dataset\*/
data fertilizer_data;
input fertilizer $ growth;
datalines ;
fert1 7
fert1 14
fert1 14
fert1 13
fert1 12
fert1 9
fert1 6
fert1 14
fert1 12
fert1 8
fert2 15
fert2 17
fert2 13
fert2 15
fert2 15
fert2 13
fert2 9
fert2 12
fert2 10
fert2 8
fert3 6
fert3 8
fert3 8
fert3 9
fert3 5
fert3 14
fert3 13
fert3 8
fert3 10
fert3 9
;
run ;
Шаг 2. Выполните тест Крускала-Уоллиса.
Далее мы будем использовать оператор proc npar1way для выполнения теста Крускала-Уоллиса, чтобы сравнить средний рост растений между тремя группами удобрений:
/\*perform Kruskal-Wallis test\*/
proc npar1way data =fertilizer_data wilcoxon dscf ;
class fertilizer;
var growth;
run ;
Шаг 3: интерпретируйте результаты
Первая таблица в выходных данных показывает общую статистику теста хи-квадрат и соответствующее значение p для теста Крускала-Уоллиса:

Значение p теста составляет 0,0431.Поскольку это значение меньше 0,05, мы отвергаем нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.
Это означает, что у нас есть достаточно доказательств, чтобы заключить, что тип используемого удобрения приводит к статистически значимым различиям в росте растений.
Последняя таблица в выходных данных показывает p-значения для попарных сравнений между каждой из трех групп:

Из этой таблицы видно, что единственное p-значение меньше 0,05 — это сравнение между удобрением 2 и удобрением 3, которое имеет p-значение 0,0390 .
Это означает, что существует статистически значимая разница в росте растений между удобрением 2 и удобрением 3, но не между любыми другими попарными сравнениями.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в SAS:
Как выполнить одновыборочный t-тест в SAS
Как выполнить двухвыборочный t-тест в SAS
Как выполнить односторонний ANOVA в SAS
Как выполнить двухсторонний ANOVA в SAS