Тест запусков — это статистический тест, который используется для определения того, получен ли набор данных из случайного процесса.
Нулевая и альтернативная гипотезы теста таковы:
H 0 (нуль): данные были получены случайным образом.
H a (альтернативный вариант): данные не были получены случайным образом.
В этом руководстве объясняются два метода, которые вы можете использовать для выполнения теста Runs в Python.
Пример: запуск теста в Python
Мы можем выполнить тест Runs для заданного набора данных в Python, используя функцию runtest_1samp() из библиотеки statsmodels , которая использует следующий синтаксис:
runtest_1samp(x, отсечение='среднее', исправление=Истина)
куда:
- x: массив значений данных
- отсечка: отсечка, используемая для разделения данных на большие и малые значения. По умолчанию используется «среднее», но вы также можете указать «медиану» в качестве альтернативы.
- Коррекция: для размера выборки менее 50 эта функция вычитает 0,5 в качестве коррекции. Вы можете указать False, чтобы отключить эту коррекцию.
Эта функция выводит статистику z-теста и соответствующее значение p в качестве выходных данных.
В следующем коде показано, как выполнить тест Run с помощью этой функции в Python:
from statsmodels. sandbox.stats.runs import runstest_1samp
#create dataset
data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13]
#Perform Runs test
runstest_1samp(data, correction= False )
(-0.6708203932499369, 0.5023349543605021)
Статистика z-теста оказывается равной -0,67082 , а соответствующее значение p равно 0,50233.Поскольку это p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что данные были получены случайным образом.
Примечание.В этом примере мы отключили коррекцию при расчете тестовой статистики. Это соответствует формуле, используемой для выполнения теста Runs в R , которая не использует коррекцию при выполнении теста.