Тест Крускала-Уоллиса: определение, формула и пример

Тест Крускала-Уоллиса: определение, формула и пример

Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп.

Этот тест является непараметрическим эквивалентом однофакторного дисперсионного анализа и обычно используется, когда нарушается предположение о нормальности.

Критерий Крускала-Уоллиса не предполагает нормальности данных и гораздо менее чувствителен к выбросам, чем однофакторный дисперсионный анализ.

Вот несколько примеров, когда вы можете провести тест Крускала-Уоллиса:

Пример 1: Сравнение методов исследования

Вы случайным образом делите класс из 90 студентов на три группы по 30 человек. Каждая группа в течение одного месяца использует разные методы обучения для подготовки к экзамену.

В конце месяца все студенты сдают один и тот же экзамен. Вы хотите знать, влияет ли техника обучения на результаты экзаменов.

Из предыдущих исследований вы знаете, что распределения экзаменационных баллов по этим трем методам обучения обычно не распределяются, поэтому вы проводите тест Крускала-Уоллиса, чтобы определить, есть ли статистически значимая разница между средними баллами трех групп.

Пример 2: Сравнение воздействия солнечного света

Вы хотите знать, влияет ли солнечный свет на рост определенного растения, поэтому вы сажаете группы семян в четырех разных местах, которые подвержены сильному солнечному свету, среднему солнечному свету, слабому солнечному свету или полному отсутствию солнечного света.

Через месяц вы измеряете высоту каждой группы растений. Известно, что распределение высот для данного конкретного растения не имеет нормального распределения и склонно к выбросам.

Чтобы определить, влияет ли солнечный свет на рост, вы проводите тест Крускала-Уоллиса, чтобы определить, есть ли статистически значимая разница между средним ростом четырех групп.

Предположения теста Крускала-Уоллиса

Прежде чем мы сможем провести тест Крускала-Уоллиса, нам нужно убедиться, что выполняются следующие предположения:

1. Порядковая или непрерывная переменная отклика — переменная отклика должна быть порядковой или непрерывной переменной. Примером порядковой переменной является вопрос ответа на опрос, измеряемый по шкале Лайкерта (например, 5-балльная шкала от «полностью не согласен» до «полностью согласен»), а примером непрерывной переменной является вес (например, измеряемый в фунтах).

2. Независимость – наблюдения в каждой группе должны быть независимыми друг от друга. Обычно рандомизированный дизайн позаботится об этом.

3. Распределения имеют сходную форму — распределения в каждой группе должны иметь одинаковую форму.

Если эти предположения выполняются, то мы можем приступить к проведению теста Крускала-Уоллиса.

Пример теста Краскела-Уоллиса

Исследователь хочет знать, оказывают ли три препарата разное влияние на боль в колене, поэтому он набирает 30 человек, которые испытывают одинаковую боль в колене, и случайным образом делит их на три группы, чтобы получить либо препарат 1, либо препарат 2, либо препарат 3.

После одного месяца приема препарата исследователь просит каждого человека оценить боль в колене по шкале от 1 до 100, где 100 указывает на самую сильную боль.

Рейтинги для всех 30 человек показаны ниже:

| Препарат 1 | Препарат 2 | Препарат 3 | | --- | --- | --- | | 78 | 71 | 57 | | 65 | 66 | 88 | | 63 | 56 | 58 | | 44 | 40 | 78 | | 50 | 55 | 65 | | 78 | 31 | 61 | | 70 | 45 | 62 | | 61 | 66 | 44 | | 50 | 47 | 48 | | 44 | 42 | 77 |

Исследователь хочет знать, по-разному ли эти три препарата влияют на боль в колене, поэтому он проводит тест Крускала-Уоллиса с уровнем значимости 0,05, чтобы определить, существует ли статистически значимая разница между средними оценками боли в колене для этих трех препаратов. группы.

Мы можем использовать следующие шаги для выполнения теста Крускала-Уоллиса:

Шаг 1. Сформулируйте гипотезы.

Нулевая гипотеза (H 0 ): средние оценки боли в колене в трех группах равны.

Альтернативная гипотеза: (Ха): по крайней мере один из медианных показателей боли в колене отличается от других.

Шаг 2. Выполните тест Крускала-Уоллиса.

Чтобы провести тест Краскела-Уоллиса, мы можем просто ввести значения, показанные выше, в Калькулятор теста Краскела-Уоллиса :

Калькулятор теста Краскела-Уоллиса

Затем нажмите кнопку «Рассчитать»:

Шаг 3. Интерпретируйте результаты.

Поскольку p-значение теста ( 0,21342 ) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

У нас нет достаточных доказательств, чтобы сказать, что существует статистически значимая разница между средними показателями боли в колене в этих трех группах.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить тест Крускала-Уоллиса с использованием различных статистических программ:

Как выполнить тест Крускала-Уоллиса в Excel
Как выполнить тест Крускала-Уоллиса в Python
Как выполнить тест Крускала-Уоллиса в SPSS
Как выполнить тест Крускала-Уоллиса в Stata
Как выполнить тест Крускала-Уоллиса в SAS
Калькулятор теста Крускала-Уоллиса онлайн

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.