Как выполнить тест чау-чау в R


Тест Чоу используется для проверки того, равны ли коэффициенты в двух разных моделях регрессии для разных наборов данных.

Этот тест обычно используется в области эконометрики с данными временных рядов, чтобы определить, есть ли структурный разрыв в данных в какой-то момент.

В этом руководстве представлен пошаговый пример выполнения теста Чоу в R.

Шаг 1: Создайте данные

Во-первых, мы создадим некоторые поддельные данные:

#create data
data <- data.frame(x = c(1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 7, 8, 8, 9, 10, 10,
 11, 12, 12, 13, 14, 15, 15, 16, 17, 18, 18, 19, 20, 20),
 y = c(3, 5, 6, 10, 13, 15, 17, 14, 20, 23, 25, 27, 30, 30, 31,
 33, 32, 32, 30, 32, 34, 34, 37, 35, 34, 36, 34, 37, 38, 36))

#view first six rows of data
head(data)

 x y
1 1 3
2 1 5
3 2 6
4 3 10
5 4 13
6 4 15

Шаг 2: Визуализируйте данные

Далее мы создадим простую диаграмму рассеяния для визуализации данных:

#load ggplot2 visualization package
library (ggplot2)

#create scatterplot
ggplot(data, aes (x = x, y = y)) +
 geom_point(col='steelblue', size= 3 )

На диаграмме рассеяния видно, что структура данных меняется при x = 10. Таким образом, мы можем выполнить тест Чоу, чтобы определить, есть ли в данных точка структурного разрыва при x = 10.

Шаг 3: Проведите тест чау-чау

Мы можем использовать функцию sctest из пакета strucchange для выполнения теста Чоу:

#load strucchange package
library (strucchange)

#perform Chow test
sctest(data$y ~ data$x, type = " Chow", point = 10 )

 Chow test

data: data$y ~ data$x
F = 110.14, p-value = 2.023e-13

По результатам теста мы видим:

  • Статистика F-теста : 110,14
  • p-значение: <.0000

Поскольку p-значение меньше 0,05, мы можем отклонить нулевую гипотезу теста. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что в данных присутствует точка структурного разрыва.

Другими словами, две линии регрессии могут лучше соответствовать модели данных, чем одна линия регрессии.