Тест Данна для множественных сравнений


Критерий Крускала-Уоллиса используется для определения наличия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

Если результаты теста Краскела-Уоллиса статистически значимы, целесообразно провести тест Данна, чтобы точно определить, какие группы отличаются.

Тест Данна выполняет попарные сравнения между каждой независимой группой и сообщает, какие группы статистически значимо различаются на каком-то уровне α.

Например, предположим, что исследователь хочет знать, по-разному ли влияют три разных препарата на боль в спине. Он набирает 30 субъектов для исследования и случайным образом назначает им прием препарата А, препарата В или препарата С в течение одного месяца, а затем измеряет их боль в спине в конце месяца.

Исследователь может выполнить тест Крускала-Уоллиса, чтобы определить, одинакова ли срединная боль в спине среди трех препаратов. Если p-значение теста Крускала-Уоллиса ниже определенного порога, можно сказать, что три препарата производят разные эффекты.

После этого исследователь может выполнить тест Данна, чтобы определить , какие лекарства вызывают статистически значимые эффекты.

Тест Данна: формула

Скорее всего, вам никогда не придется выполнять тест Данна вручную, поскольку его можно выполнить с помощью статистического программного обеспечения (например, R, Python, Stata, SPSS и т. д.), но формула для расчета статистики z-теста для разницы между двумя группами:

z я = y я / σ я

где i — одно из сравнений от 1 до m , y i = WA — W B (где WA — среднее значение суммы рангов для i -й группы), а σ i рассчитывается как:

σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))

где N — общее количество наблюдений во всех группах, r — количество связанных рангов, а Ts — количество наблюдений, связанных с s -м конкретным связанным значением.

Как контролировать частоту ошибок по семейным обстоятельствам

Всякий раз, когда мы делаем несколько сравнений одновременно, важно, чтобы мы контролировали частоту ошибок в отношении всей семьи.Один из способов сделать это — скорректировать p-значения, полученные в результате множественных сравнений.

Существует несколько способов корректировки p-значений, но наиболее распространены два метода корректировки:

1. Поправка Бонферрони

Скорректированное значение p = p*m

куда:

  • p: Исходное значение p
  • m: общее количество сделанных сравнений

2. Корректировка Сидака

Скорректированное значение p = 1 – (1-p) м

куда:

  • p: Исходное значение p
  • m: общее количество сделанных сравнений

Используя одну из этих корректировок p-значения, мы можем значительно снизить вероятность совершения ошибки первого рода среди множества множественных сравнений.

Дополнительные ресурсы

Как выполнить тест Данна в R
Как выполнить тест Данна в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.