Тест запусков — это статистический тест, который используется для определения того, получен ли набор данных из случайного процесса.
Нулевая и альтернативная гипотезы теста таковы:
H 0 (нуль): данные были получены случайным образом.
H a (альтернативный вариант): данные не были получены случайным образом.
В этом руководстве объясняются два метода, которые можно использовать для выполнения теста Runs в R. Обратите внимание, что оба метода приводят к одинаковым результатам экзамена.
Способ 1: запустить тест с использованием библиотеки snpar
Первый способ, которым вы можете выполнить тест Run, — это функция run.test() из библиотеки snpar , которая использует следующий синтаксис:
run.test(x, точное = FALSE, альтернативное = c("двустороннее", "меньше", "больше"))
куда:
- x: числовой вектор значений данных.
- точно: Указывает, следует ли рассчитывать точное значение p. Это FALSE по умолчанию. Если количество прогонов довольно мало, вы можете изменить это значение на TRUE.
- альтернатива: указывает на альтернативную гипотезу. По умолчанию двусторонний.
В следующем коде показано, как выполнить тест Run с помощью этой функции в R:
library(snpar)
#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)
#perform Run's test
runs.test(data)
Approximate runs rest
data: data
Runs = 5, p-value = 0.5023
alternative hypothesis: two.sided
Значение p теста составляет 0,5023.Поскольку это не меньше, чем α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что данные были получены случайным образом.
Способ 2: запустить тест с использованием библиотеки randtests
Второй способ, которым вы можете выполнить тест Run, — это функция run.test() из библиотеки randtests , которая использует следующий синтаксис:
run.test(x, альтернатива = c("двусторонний", "меньше", "больше"))
куда:
- x: числовой вектор значений данных.
- альтернатива: указывает на альтернативную гипотезу. По умолчанию двусторонний.
В следующем коде показано, как выполнить тест Run с помощью этой функции в R:
library(randtests)
#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)
#perform Run's test
runs.test(data)
Runs Test
data: data
statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value =
0.5023
alternative hypothesis: nonrandomness
Еще раз p-значение теста составляет 0,5023.Поскольку это не меньше, чем α = 0,05, мы не можем отвергнуть нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что данные были получены случайным образом.