Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
Если результаты теста Краскела-Уоллиса статистически значимы, целесообразно провести тест Данна, чтобы точно определить, какие группы отличаются.
Тест Данна выполняет попарные сравнения между каждой независимой группой и сообщает, какие группы статистически значимо различаются на каком-то уровне α.
Например, предположим, что исследователь хочет знать, по-разному ли влияют три разных препарата на боль в спине. Он набирает 30 субъектов для исследования и случайным образом назначает им прием препарата А, препарата В или препарата С в течение одного месяца, а затем измеряет их боль в спине в конце месяца.
Исследователь может выполнить тест Крускала-Уоллиса, чтобы определить, одинакова ли срединная боль в спине среди трех препаратов. Если p-значение теста Крускала-Уоллиса ниже определенного порога, можно сказать, что три препарата производят разные эффекты.
После этого исследователь может выполнить тест Данна, чтобы определить , какие лекарства вызывают статистически значимые эффекты.
Тест Данна: формула
Скорее всего, вам никогда не придется выполнять тест Данна вручную, поскольку его можно выполнить с помощью статистического программного обеспечения (например, R, Python, Stata, SPSS и т. д.), но формула для расчета статистики z-теста для разницы между двумя группами:
z я = y я / σ я
где i — одно из сравнений от 1 до m , y i = WA — W B (где WA — среднее значение суммы рангов для i -й группы), а σ i рассчитывается как:
σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))
где N — общее количество наблюдений во всех группах, r — количество связанных рангов, а Ts — количество наблюдений, связанных с s -м конкретным связанным значением.
Как контролировать частоту ошибок по семейным обстоятельствам
Всякий раз, когда мы делаем несколько сравнений одновременно, важно, чтобы мы контролировали частоту ошибок в отношении всей семьи.Один из способов сделать это — скорректировать p-значения, полученные в результате множественных сравнений.
Существует несколько способов корректировки p-значений, но наиболее распространены два метода корректировки:
1. Поправка Бонферрони
Скорректированное значение p = p*m
куда:
- p: Исходное значение p
- m: общее количество сделанных сравнений
2. Корректировка Сидака
Скорректированное значение p = 1 – (1-p) м
куда:
- p: Исходное значение p
- m: общее количество сделанных сравнений
Используя одну из этих корректировок p-значения, мы можем значительно снизить вероятность совершения ошибки первого рода среди множества множественных сравнений.
Дополнительные ресурсы
Как выполнить тест Данна в R
Как выполнить тест Данна в Python