Как рассчитать P-значение статистики хи-квадрат в R


Всякий раз, когда вы проводите тест хи-квадрат, вы получаете статистику теста хи-квадрат. Затем вы можете найти p-значение, соответствующее этой статистике теста, чтобы определить, являются ли результаты теста статистически значимыми.

Чтобы найти p-значение, соответствующее статистике теста хи-квадрат в R, вы можете использовать функцию pchisq() , которая использует следующий синтаксис:

pchisq(q, df, нижний.хвост = ИСТИНА)

куда:

  • q: Статистика теста хи-квадрат
  • df: Степени свободы
  • нижний.хвост: если TRUE, возвращается вероятность слева от q в распределении хи-квадрат. Если FALSE, возвращается вероятность справа от q в распределении хи-квадрат. Значение по умолчанию — ИСТИНА.

В следующих примерах показано, как использовать эту функцию на практике.

Пример 1. Хи-квадрат критерия согласия

Владелец магазина утверждает, что каждый будний день в его магазин приходит одинаковое количество покупателей. Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, которые заходят в магазин на определенной неделе, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

После выполнения теста Хи-квадрат добросовестности исследователь обнаруживает следующее:

Статистика теста хи-квадрат (X 2 ): 4,36

Степени свободы:(df): 4

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

#find p-value for the Chi-Square test statistic
pchisq(q=4.36, df=4, lower.tail= FALSE )

[1] 0.3594721

Значение p оказывается равным 0,359.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.

Пример 2: критерий независимости хи-квадрат

Исследователи хотят знать, связан ли пол с предпочтениями политических партий. Они берут простую случайную выборку из 500 избирателей и опрашивают их на предмет их политических партийных предпочтений. После выполнения критерия независимости хи-квадрат они обнаруживают следующее:

Статистика теста хи-квадрат (X 2 ): 0,8642

Степени свободы:(df): 2

Чтобы найти значение p, связанное с этой статистикой теста хи-квадрат и степенями свободы, мы можем использовать следующий код в R:

#find p-value for the Chi-Square test statistic
pchisq(q=0.8642, df=2, lower.tail= FALSE )

[1] 0.6491445

Значение p оказывается равным 0,649.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Связанный: Как выполнить тест независимости хи-квадрат в R

Полную документацию по функции pchisq() можно найти здесь .

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.