Как выполнить критерий согласия хи-квадрат в R


Хи-квадрат критерий согласия используется для определения того, следует ли категориальная переменная гипотетическому распределению.

В этом руководстве объясняется, как выполнить критерий согласия хи-квадрат в R.

Пример: критерий согласия хи-квадрат в R

Владелец магазина утверждает, что каждый будний день в его магазин приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, исследователь записывает количество покупателей, которые заходят в магазин на данной неделе, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

Выполните следующие шаги, чтобы выполнить тест на соответствие хи-квадрат в R, чтобы определить, согласуются ли данные с заявлением владельца магазина.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения наблюдаемых частот и ожидаемой доли клиентов на каждый день:

observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Шаг 2: Проведите тест на соответствие хи-квадрату.

Затем мы можем выполнить критерий согласия хи-квадрат с помощью функции chisq.test() , которая использует следующий синтаксис:

chisq.test(x, p)

куда:

  • x: Числовой вектор наблюдаемых частот.
  • p: Числовой вектор ожидаемых пропорций.

Следующий код показывает, как использовать эту функцию в нашем примере:

#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

 Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

Статистический показатель теста хи-квадрат равен 4,36 , а соответствующее значение p равно 0,3595 .

Обратите внимание, что значение p соответствует значению хи-квадрата с n-1 степенями свободы (степеней свободы), где n — количество различных категорий. В этом случае dof = 5-1 = 4.

Вы можете использовать Калькулятор значений хи-квадрат для P , чтобы убедиться, что p-значение, соответствующее X 2 = 4,36 с степенями свободы = 4, равно 0,35947 .

Напомним, что критерий согласия Хи-квадрат использует следующие нулевую и альтернативную гипотезы:

  • H 0 : (нулевая гипотеза) Переменная следует за гипотетическим распределением.
  • H 1 : (альтернативная гипотеза) Переменная не подчиняется предполагаемому распределению.

Поскольку p-значение (0,35947) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.

Дополнительные ресурсы

Как выполнить тест независимости хи-квадрат в R
Как рассчитать P-значение статистики хи-квадрат в R
Как найти критическое значение хи-квадрат в R