Как рассчитать P-значение статистики хи-квадрат в R


Всякий раз, когда вы проводите тест хи-квадрат, вы получаете статистику теста хи-квадрат. Затем вы можете найти p-значение, соответствующее этой статистике теста, чтобы определить, являются ли результаты теста статистически значимыми.

Чтобы найти p-значение, соответствующее статистике теста хи-квадрат в R, вы можете использовать функцию pchisq() , которая использует следующий синтаксис:

pchisq(q, df, нижний.хвост = ИСТИНА)

куда:

  • q: Статистика теста хи-квадрат
  • df: Степени свободы
  • нижний.хвост: если TRUE, возвращается вероятность слева от q в распределении хи-квадрат. Если FALSE, возвращается вероятность справа от q в распределении хи-квадрат. Значение по умолчанию — ИСТИНА.

В следующих примерах показано, как использовать эту функцию на практике.

Пример 1. Хи-квадрат критерия согласия

Владелец магазина утверждает, что каждый будний день в его магазин приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, которые заходят в магазин на определенной неделе, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

После выполнения теста Хи-квадрат добросовестности исследователь обнаруживает следующее:

Статистика теста хи-квадрат (X 2 ): 4,36

Степени свободы:(df): 4

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

#find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )

[1] 0.3594721

Значение p оказывается равным 0,359.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.

Пример 2: критерий независимости хи-квадрат

Исследователи хотят знать, связан ли пол с предпочтениями политических партий. Они берут простую случайную выборку из 500 избирателей и опрашивают их на предмет их политических партийных предпочтений. После выполнения критерия независимости хи-квадрат они обнаруживают следующее:

Статистика теста хи-квадрат (X 2 ): 0,8642

Степени свободы:(df): 2

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

#find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )

[1] 0.6491445

Значение p оказывается равным 0,649.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Связанный: Как выполнить тест независимости хи-квадрат в R

Полную документацию по функции pchisq() можно найти здесь .