Всякий раз, когда вы проводите тест хи-квадрат, вы получаете статистику теста хи-квадрат. Затем вы можете найти p-значение, соответствующее этой статистике теста, чтобы определить, являются ли результаты теста статистически значимыми.
Чтобы найти p-значение, соответствующее статистике теста хи-квадрат в R, вы можете использовать функцию pchisq() , которая использует следующий синтаксис:
pchisq(q, df, нижний.хвост = ИСТИНА)
куда:
- q: Статистика теста хи-квадрат
- df: Степени свободы
- нижний.хвост: если TRUE, возвращается вероятность слева от q в распределении хи-квадрат. Если FALSE, возвращается вероятность справа от q в распределении хи-квадрат. Значение по умолчанию — ИСТИНА.
В следующих примерах показано, как использовать эту функцию на практике.
Пример 1. Хи-квадрат критерия согласия
Владелец магазина утверждает, что каждый будний день в его магазин приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, которые заходят в магазин на определенной неделе, и обнаруживает следующее:
- Понедельник: 50 клиентов
- вторник: 60 клиентов
- Среда: 40 клиентов
- Четверг: 47 клиентов
- Пятница: 53 клиента
После выполнения теста Хи-квадрат добросовестности исследователь обнаруживает следующее:
Статистика теста хи-квадрат (X 2 ): 4,36
Степени свободы:(df): 4
Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:
#find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )
[1] 0.3594721
Значение p оказывается равным 0,359.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.
Пример 2: критерий независимости хи-квадрат
Исследователи хотят знать, связан ли пол с предпочтениями политических партий. Они берут простую случайную выборку из 500 избирателей и опрашивают их на предмет их политических партийных предпочтений. После выполнения критерия независимости хи-квадрат они обнаруживают следующее:
Статистика теста хи-квадрат (X 2 ): 0,8642
Степени свободы:(df): 2
Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:
#find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )
[1] 0.6491445
Значение p оказывается равным 0,649.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.
Связанный: Как выполнить тест независимости хи-квадрат в R
Полную документацию по функции pchisq() можно найти здесь .