Как провести знаковый ранговый тест Уилкоксона в Python


Критерий знакового ранга Уилкоксона — это непараметрическая версия t-критерия для парных выборок .

Он используется для проверки наличия значительной разницы между двумя средними значениями генеральной совокупности, когда распределение различий между двумя выборками нельзя считать нормальным.

В этом руководстве объясняется, как провести знаковый ранговый тест Уилкоксона в Python.

Пример: знаковый ранговый тест Уилкоксона в Python

Исследователи хотят знать, приводит ли новая обработка топлива к изменению среднего расхода топлива на галлон определенного автомобиля. Чтобы проверить это, они измеряют количество миль на галлон 12 автомобилей с обработкой топлива и без нее.

Используйте следующие шаги, чтобы выполнить знаковый ранговый тест Уилкоксона в Python, чтобы определить, есть ли разница в среднем показателе миль на галлон между двумя группами.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения значений миль на галлон для каждой группы автомобилей:

group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19]
group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]

Шаг 2: Проведите знаковый ранговый тест Уилкоксона.

Далее мы воспользуемся функцией wilcoxon() из библиотеки scipy.stats для проведения теста Wilcoxon Signed-Rank, который использует следующий синтаксис:

Уилкоксон (x, y, альтернатива = 'двусторонний')

куда:

  • x: массив выборочных наблюдений из группы 1
  • y: массив выборочных наблюдений из группы 2
  • альтернатива: определяет альтернативную гипотезу. По умолчанию используется «двусторонний», но другие варианты включают «меньше» и «больше».

Вот как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

#perform the Wilcoxon-Signed Rank Test
stats.wilcoxon(group1, group2)

(statistic=10.5, pvalue=0.044)

Статистика теста равна 10,5 , а соответствующее двустороннее значение p равно 0,044 .

Шаг 3: Интерпретируйте результаты.

В этом примере критерий знакового ранга Уилкоксона использует следующие нулевую и альтернативную гипотезы:

H 0 : миль на галлон равны между двумя группами

H A : Расход топлива в милях на галлон для двух групп неодинаков .

Поскольку p-значение ( 0,044 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинное среднее значение миль на галлон не равно между двумя группами.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.