Как провести U-тест Манна-Уитни в Python


U- критерий Манна-Уитни используется для сравнения различий между двумя выборками, когда распределение выборки не является нормальным, а размеры выборки малы (n < 30).

Он считается непараметрическим эквивалентом двухвыборочного t-критерия .

В этом руководстве объясняется, как провести U-тест Манна-Уитни в Python.

Пример: U-тест Манна-Уитни в Python

Исследователи хотят знать, приводит ли обработка топлива к изменению среднего расхода топлива на галлон автомобиля. Чтобы проверить это, они измерили расход 12 автомобилей с обработкой топлива и 12 машин без нее.

Поскольку размеры выборки невелики, и исследователи подозревают, что распределение выборки не является нормальным, они решили выполнить U-критерий Манна-Уитни, чтобы определить, есть ли статистически значимая разница в милях на галлон между двумя группами.

Выполните следующие шаги, чтобы провести U-тест Манна-Уитни в Python.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения значений миль на галлон для каждой группы автомобилей:

group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19]
**group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]

Шаг 2: Проведите U-тест Манна-Уитни.

Далее мы будем использовать функцию mannwhitneyu() из библиотеки scipy.stats для проведения U-теста Манна-Уитни, который использует следующий синтаксис:

mannwhitneyu(x, y, use_continuity=True, альтернатива=None)

куда:

  • x: массив выборочных наблюдений из группы 1
  • y: массив выборочных наблюдений из группы 2
  • use_continuity: следует ли учитывать поправку на непрерывность (1/2). Значение по умолчанию — Истина.
  • альтернатива: определяет альтернативную гипотезу. По умолчанию используется значение «Нет», которое вычисляет значение p, равное половине размера «двустороннего» значения p. Другие варианты включают «двусторонний», «меньше» и «больше».

Вот как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

#perform the Mann-Whitney U test
stats. mannwhitneyu (group1, group2, alternative='two-sided')

(statistic=50.0, pvalue=0.2114)

Статистика теста равна 50,0 , а соответствующее двустороннее значение p равно 0,2114 .

Шаг 3: Интерпретируйте результаты.

В этом примере U-критерий Манна-Уитни использует следующие нулевую и альтернативную гипотезы:

H 0 : миль на галлон равны между двумя группами

H A : Расход топлива в милях на галлон для двух групп неодинаков .

Поскольку p-значение ( 0,2114 ) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы сказать, что истинное среднее значение миль на галлон различается между двумя группами.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнить U-критерий Манна-Уитни в различных статистических программах:

Как выполнить U-тест Манна-Уитни в Excel
Как выполнить U-тест Манна-Уитни в R
Как выполнить U-тест Манна-Уитни в SPSS

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.