Как провести T-тест для парных выборок в Python


Стьюдентный критерий для парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть сопоставлено с наблюдением в другой выборке.

В этом руководстве объясняется, как провести t-тест парных выборок в Python.

Пример: Т-тест для парных выборок в Python

Предположим, мы хотим знать, значительно ли влияет определенная учебная программа на успеваемость студента на конкретном экзамене. Чтобы проверить это, у нас есть 15 учеников в классе, которые проходят предварительный тест. Затем каждый из студентов участвует в учебной программе в течение двух недель. Затем учащиеся пересдают тест аналогичной сложности.

Чтобы сравнить разницу между средними баллами по первому и второму тесту, мы используем t-критерий для парных выборок, потому что для каждого учащегося его балл за первый тест можно сопоставить с баллом за второй тест.

Выполните следующие шаги, чтобы провести t-тест парных выборок в Python.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения оценок до и после теста:

pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91]
**post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]

Шаг 2: Проведите Т-тест для парных образцов.

Далее мы будем использовать функцию ttest_rel() из библиотеки scipy.stats для проведения t-теста парных выборок, который использует следующий синтаксис:

ttest_rel(a, b)

куда:

  • a: массив выборочных наблюдений из группы 1
  • b: массив выборочных наблюдений из группы 2

Вот как использовать эту функцию в нашем конкретном примере:

import scipy.stats as stats

#perform the paired samples t-test
stats.ttest_rel(pre, post)

(statistic=-2.9732, pvalue=0.0101)

Статистика теста равна -2,9732 , а соответствующее двустороннее значение p равно 0,0101 .

Шаг 3: Интерпретируйте результаты.

В этом примере t-критерий парных выборок использует следующие нулевую и альтернативную гипотезы:

H 0 : Средние баллы до и после теста равны.

H A : Средние баллы до и после теста не равны.

Поскольку p-значение ( 0,0101 ) меньше 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинный средний балл теста отличается для студентов до и после участия в учебной программе.