Тест независимости хи-квадрат в R (с примерами)


Критерий независимости хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными .

В этом руководстве объясняется, как выполнить критерий независимости хи-квадрат в R.

Пример: критерий независимости хи-квадрат в R

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:

|  |  |  |  |  | | --- | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | Общий | | Мужской | 120 | 90 | 40 | 250 | | женский | 110 | 95 | 45 | 250 | | Общий | 230 | 185 | 85 | 500 |

Используйте следующие шаги, чтобы выполнить тест независимости хи-квадрат в R, чтобы определить, связан ли пол с предпочтениями политической партии.

Шаг 1: Создайте данные.

Сначала мы создадим таблицу для хранения наших данных:

#create table
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE )
colnames(data) <- c(" Rep"," Dem"," Ind ")
rownames(data) <- c(" Male"," Female ")
data <- as.table (data)

#view table
data

 Rep Dem Ind
Male 120 90 40
Female 110 95 45

Шаг 2: Выполните тест независимости хи-квадрат.

Затем мы можем выполнить критерий независимости хи-квадрат, используя функцию chisq.test() :

#Perform Chi-Square Test of Independence
chisq.test(data)

 Pearson's Chi-squared test

data: data
X-squared = 0.86404, df = 2, p-value = 0.6492

Способ интерпретации вывода следующий:

  • Статистика теста хи-квадрат: 0,86404
  • Степени свободы: 2 (рассчитывается как #rows-1 * #columns-1)
  • р-значение: 0,6492

Напомним, что критерий независимости хи-квадрат использует следующие нулевые и альтернативные гипотезы:

  • H 0 : (нулевая гипотеза) Две переменные независимы.
  • H 1 : (альтернативная гипотеза) Две переменные не являются независимыми.

Поскольку p-значение (0,6492) теста не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Другими словами, предпочтения пола и политической партии не зависят друг от друга.

Дополнительные ресурсы

Введение в критерий независимости хи-квадрат
Калькулятор критерия хи-квадрат независимости
Как рассчитать P-значение статистики хи-квадрат в R
Как найти критическое значение хи-квадрат в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.