Как провести U-тест Манна-Уитни в Python


U- критерий Манна-Уитни используется для сравнения различий между двумя выборками, когда распределение выборки не является нормальным, а размеры выборки малы (n < 30).

Он считается непараметрическим эквивалентом двухвыборочного t-критерия .

В этом руководстве объясняется, как провести U-тест Манна-Уитни в Python.

Пример: U-тест Манна-Уитни в Python

Исследователи хотят знать, приводит ли обработка топлива к изменению среднего расхода топлива на галлон автомобиля. Чтобы проверить это, они измерили расход 12 автомобилей с обработкой топлива и 12 машин без нее.

Поскольку размеры выборки невелики, и исследователи подозревают, что распределение выборки не является нормальным, они решили выполнить U-критерий Манна-Уитни, чтобы определить, есть ли статистически значимая разница в милях на галлон между двумя группами.

Выполните следующие шаги, чтобы провести U-тест Манна-Уитни в Python.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения значений миль на галлон для каждой группы автомобилей:

group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19]
**group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]

Шаг 2: Проведите U-тест Манна-Уитни.

Далее мы будем использовать функцию mannwhitneyu() из библиотеки scipy.stats для проведения U-теста Манна-Уитни, который использует следующий синтаксис:

mannwhitneyu(x, y, use_continuity=True, альтернатива=None)

куда:

  • x: массив выборочных наблюдений из группы 1
  • y: массив выборочных наблюдений из группы 2
  • use_continuity: следует ли учитывать поправку на непрерывность (1/2). Значение по умолчанию — Истина.
  • альтернатива: определяет альтернативную гипотезу. По умолчанию используется значение «Нет», которое вычисляет значение p, равное половине размера «двустороннего» значения p. Другие варианты включают «двусторонний», «меньше» и «больше».

Вот как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

#perform the Mann-Whitney U test
stats. mannwhitneyu (group1, group2, alternative='two-sided')

(statistic=50.0, pvalue=0.2114)

Статистика теста равна 50,0 , а соответствующее двустороннее значение p равно 0,2114 .

Шаг 3: Интерпретируйте результаты.

В этом примере U-критерий Манна-Уитни использует следующие нулевую и альтернативную гипотезы:

H 0 : миль на галлон равны между двумя группами

H A : Расход топлива в милях на галлон для двух групп неодинаков .

Поскольку p-значение ( 0,2114 ) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы сказать, что истинное среднее значение миль на галлон различается между двумя группами.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить U-критерий Манна-Уитни в различных статистических программах:

Как выполнить U-тест Манна-Уитни в Excel
Как выполнить U-тест Манна-Уитни в R
Как выполнить U-тест Манна-Уитни в SPSS