Тест Данна для множественных сравнений


Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

Если результаты теста Краскела-Уоллиса статистически значимы, целесообразно провести тест Данна, чтобы точно определить, какие группы отличаются.

Тест Данна выполняет попарные сравнения между каждой независимой группой и сообщает, какие группы статистически значимо различаются на каком-то уровне α.

Например, предположим, что исследователь хочет знать, по-разному ли влияют три разных препарата на боль в спине. Он набирает 30 субъектов для исследования и случайным образом назначает им прием препарата А, препарата В или препарата С в течение одного месяца, а затем измеряет их боль в спине в конце месяца.

Исследователь может выполнить тест Крускала-Уоллиса, чтобы определить, одинакова ли срединная боль в спине среди трех препаратов. Если p-значение теста Крускала-Уоллиса ниже определенного порога, можно сказать, что три препарата производят разные эффекты.

После этого исследователь может выполнить тест Данна, чтобы определить , какие лекарства вызывают статистически значимые эффекты.

Тест Данна: формула

Скорее всего, вам никогда не придется выполнять тест Данна вручную, поскольку его можно выполнить с помощью статистического программного обеспечения (например, R, Python, Stata, SPSS и т. д.), но формула для расчета статистики z-теста для разницы между двумя группами:

z я = y я / σ я

где i — одно из сравнений от 1 до m , y i = WA — W B (где WA — среднее значение суммы рангов для i -й группы), а σ i рассчитывается как:

σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))

где N — общее количество наблюдений во всех группах, r — количество связанных рангов, а Ts — количество наблюдений, связанных с s -м конкретным связанным значением.

Как контролировать частоту ошибок по семейным обстоятельствам

Всякий раз, когда мы делаем несколько сравнений одновременно, важно, чтобы мы контролировали частоту ошибок в отношении всей семьи.Один из способов сделать это — скорректировать p-значения, полученные в результате множественных сравнений.

Существует несколько способов корректировки p-значений, но наиболее распространены два метода корректировки:

1. Поправка Бонферрони

Скорректированное значение p = p*m

куда:

  • p: Исходное значение p
  • m: общее количество сделанных сравнений

2. Корректировка Сидака

Скорректированное значение p = 1 – (1-p) м

куда:

  • p: Исходное значение p
  • m: общее количество сделанных сравнений

Используя одну из этих корректировок p-значения, мы можем значительно снизить вероятность совершения ошибки первого рода среди множества множественных сравнений.

Дополнительные ресурсы

Как выполнить тест Данна в R
Как выполнить тест Данна в Python