Критерий знакового ранга Уилкоксона — это непараметрическая версия t-критерия для парных выборок .
Он используется для проверки наличия значительной разницы между двумя средними значениями генеральной совокупности, когда распределение различий между двумя выборками нельзя считать нормальным.
В этом руководстве объясняется, как провести знаковый ранговый тест Уилкоксона в Python.
Пример: знаковый ранговый тест Уилкоксона в Python
Исследователи хотят знать, приводит ли новая обработка топлива к изменению среднего расхода топлива на галлон определенного автомобиля. Чтобы проверить это, они измеряют количество миль на галлон 12 автомобилей с обработкой топлива и без нее.
Используйте следующие шаги, чтобы выполнить знаковый ранговый тест Уилкоксона в Python, чтобы определить, есть ли разница в среднем показателе миль на галлон между двумя группами.
Шаг 1: Создайте данные.
Во-первых, мы создадим два массива для хранения значений миль на галлон для каждой группы автомобилей:
group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19]
group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]
Шаг 2: Проведите знаковый ранговый тест Уилкоксона.
Далее мы воспользуемся функцией wilcoxon() из библиотеки scipy.stats для проведения теста Wilcoxon Signed-Rank, который использует следующий синтаксис:
Уилкоксон (x, y, альтернатива = 'двусторонний')
куда:
- x: массив выборочных наблюдений из группы 1
- y: массив выборочных наблюдений из группы 2
- альтернатива: определяет альтернативную гипотезу. По умолчанию используется «двусторонний», но другие варианты включают «меньше» и «больше».
Вот как использовать эту функцию в нашем конкретном примере:
import scipy.stats as stats
#perform the Wilcoxon-Signed Rank Test
stats.wilcoxon(group1, group2)
(statistic=10.5, pvalue=0.044)
Статистика теста равна 10,5 , а соответствующее двустороннее значение p равно 0,044 .
Шаг 3: Интерпретируйте результаты.
В этом примере критерий знакового ранга Уилкоксона использует следующие нулевую и альтернативную гипотезы:
H 0 : миль на галлон равны между двумя группами
H A : Расход топлива в милях на галлон для двух групп неодинаков .
Поскольку p-значение ( 0,044 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинное среднее значение миль на галлон не равно между двумя группами.