Как провести T-тест для парных выборок в Python


Стьюдентный критерий для парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть сопоставлено с наблюдением в другой выборке.

В этом руководстве объясняется, как провести t-тест парных выборок в Python.

Пример: Т-тест для парных выборок в Python

Предположим, мы хотим знать, значительно ли влияет определенная учебная программа на успеваемость студента на конкретном экзамене. Чтобы проверить это, у нас есть 15 учеников в классе, которые проходят предварительный тест. Затем каждый из студентов участвует в учебной программе в течение двух недель. Затем учащиеся пересдают тест аналогичной сложности.

Чтобы сравнить разницу между средними баллами по первому и второму тесту, мы используем t-критерий для парных выборок, потому что для каждого учащегося его балл за первый тест можно сопоставить с баллом за второй тест.

Выполните следующие шаги, чтобы провести t-тест парных выборок в Python.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения оценок до и после теста:

pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91]
**post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]

Шаг 2: Проведите Т-тест для парных образцов.

Далее мы будем использовать функцию ttest_rel() из библиотеки scipy.stats для проведения t-теста парных выборок, который использует следующий синтаксис:

ttest_rel(a, b)

куда:

  • a: массив выборочных наблюдений из группы 1
  • b: массив выборочных наблюдений из группы 2

Вот как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

#perform the paired samples t-test
stats.ttest_rel(pre, post)

(statistic=-2.9732, pvalue=0.0101)

Статистика теста равна -2,9732 , а соответствующее двустороннее значение p равно 0,0101 .

Шаг 3: Интерпретируйте результаты.

В этом примере t-критерий парных выборок использует следующие нулевую и альтернативную гипотезы:

H 0 : Средние баллы до и после теста равны.

H A : Средние баллы до и после теста не равны.

Поскольку p-значение ( 0,0101 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинный средний балл теста отличается для студентов до и после участия в учебной программе.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.