Как выполнить критерий согласия хи-квадрат в R


Хи-квадрат критерий согласия используется для определения того, следует ли категориальная переменная гипотетическому распределению.

В этом руководстве объясняется, как выполнить критерий согласия хи-квадрат в R.

Пример: критерий согласия хи-квадрат в R

Владелец магазина утверждает, что каждый будний день в его магазин приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, исследователь записывает количество покупателей, которые заходят в магазин на данной неделе, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

Выполните следующие шаги, чтобы выполнить тест на соответствие хи-квадрат в R, чтобы определить, согласуются ли данные с заявлением владельца магазина.

Шаг 1: Создайте данные.

Во-первых, мы создадим два массива для хранения наблюдаемых частот и ожидаемой доли клиентов на каждый день:

observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Шаг 2: Проведите тест на соответствие хи-квадрату.

Затем мы можем выполнить критерий согласия хи-квадрат с помощью функции chisq.test() , которая использует следующий синтаксис:

chisq.test(x, p)

куда:

  • x: Числовой вектор наблюдаемых частот.
  • p: Числовой вектор ожидаемых пропорций.

Следующий код показывает, как использовать эту функцию в нашем примере:

#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

 Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

Статистический показатель теста хи-квадрат равен 4,36 , а соответствующее значение p равно 0,3595 .

Обратите внимание, что значение p соответствует значению хи-квадрата с n-1 степенями свободы (степеней свободы), где n — количество различных категорий. В этом случае dof = 5-1 = 4.

Вы можете использовать Калькулятор значений хи-квадрат для P , чтобы убедиться, что p-значение, соответствующее X 2 = 4,36 с степенями свободы = 4, равно 0,35947 .

Напомним, что критерий согласия Хи-квадрат использует следующие нулевую и альтернативную гипотезы:

  • H 0 : (нулевая гипотеза) Переменная следует за гипотетическим распределением.
  • H 1 : (альтернативная гипотеза) Переменная не подчиняется предполагаемому распределению.

Поскольку p-значение (0,35947) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.

Дополнительные ресурсы

Как выполнить тест независимости хи-квадрат в R
Как рассчитать P-значение статистики хи-квадрат в R
Как найти критическое значение хи-квадрат в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.