Как выполнить дисперсионный анализ с повторными измерениями в Python


Повторные измерения ANOVA используются для определения того, существует ли статистически значимая разница между средними значениями трех или более групп, в которых одни и те же субъекты обнаруживаются в каждой группе.

В этом руководстве объясняется, как проводить однофакторный дисперсионный анализ с повторными измерениями в Python.

Пример. Дисперсионный анализ с повторными измерениями в Python

Исследователи хотят знать, приводят ли четыре разных препарата к разному времени реакции. Чтобы проверить это, они измеряют время реакции пяти пациентов на четыре разных препарата. Поскольку каждый пациент измеряется на каждом из четырех препаратов, мы будем использовать повторные измерения ANOVA, чтобы определить, отличается ли среднее время реакции между препаратами.

Используйте следующие шаги для выполнения повторных измерений ANOVA в Python.

Шаг 1: Введите данные.

Во-первых, мы создадим DataFrame pandas для хранения наших данных:

import numpy as np
import pandas as pd

#create data
df = pd.DataFrame({'patient': np.repeat([1, 2, 3, 4, 5], 4),
 'drug': np.tile([1, 2, 3, 4], 5),
 'response': [30, 28, 16, 34,
 14, 18, 10, 22,
 24, 20, 18, 30,
 38, 34, 20, 44, 
 26, 28, 14, 30]})

#view first ten rows of data 
df.head[:10]


 patient drug response
0 1 1 30
1 1 2 28
2 1 3 16
3 1 4 34
4 2 1 14
5 2 2 18
6 2 3 10
7 2 4 22
8 3 1 24
9 3 2 20 

Шаг 2: Выполните повторные измерения ANOVA.

Далее мы выполним повторные измерения ANOVA, используя функцию AnovaRM() из библиотеки statsmodels:

from statsmodels.stats.anova import AnovaRM

#perform the repeated measures ANOVA
print(AnovaRM(data= df , depvar='response', subject='patient', within=['drug']).fit())

 Anova
==================================
 F Value Num DF Den DF Pr > F
----------------------------------
drug 24.7589 3.0000 12.0000 0.0000
==================================

Шаг 3: Интерпретируйте результаты.

ANOVA с повторными измерениями использует следующие нулевую и альтернативную гипотезы:

Нулевая гипотеза (H 0 ): µ 1 = µ 2 = µ 3 (все средние значения населения равны)

Альтернативная гипотеза: (Ha): по крайней мере одно среднее значение генеральной совокупности отличается от остальных

В этом примере статистика теста F равна 24,7589 , а соответствующее значение p равно 0,0000.Поскольку это p-значение меньше 0,05, мы отклоняем нулевую гипотезу и делаем вывод, что существует статистически значимая разница в среднем времени ответа между четырьмя препаратами.

Шаг 4: Сообщите о результатах.

Наконец, мы сообщим о результатах наших повторных измерений ANOVA. Вот пример того, как это сделать:

Односторонний повторный анализ ANOVA был проведен на 5 людях, чтобы изучить влияние четырех разных препаратов на время отклика.
Результаты показали, что тип используемого препарата приводит к статистически значимым различиям во времени ответа (F(3, 12) = 24,75887, p <0,001).
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.