Тест независимости хи-квадрат в R (с примерами)


Критерий независимости хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными .

В этом руководстве объясняется, как выполнить критерий независимости хи-квадрат в R.

Пример: критерий независимости хи-квадрат в R

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:

|  |  |  |  |  | | --- | --- | --- | --- | --- | |  | республиканец | демократ | Независимый | Общий | | Мужской | 120 | 90 | 40 | 250 | | женский | 110 | 95 | 45 | 250 | | Общий | 230 | 185 | 85 | 500 |

Используйте следующие шаги, чтобы выполнить тест независимости хи-квадрат в R, чтобы определить, связан ли пол с предпочтениями политической партии.

Шаг 1: Создайте данные.

Сначала мы создадим таблицу для хранения наших данных:

#create table
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE )
colnames(data) <- c(" Rep"," Dem"," Ind ")
rownames(data) <- c(" Male"," Female ")
data <- as.table (data)

#view table
data

 Rep Dem Ind
Male 120 90 40
Female 110 95 45

Шаг 2: Выполните тест независимости хи-квадрат.

Затем мы можем выполнить критерий независимости хи-квадрат, используя функцию chisq.test() :

#Perform Chi-Square Test of Independence
chisq.test(data)

 Pearson's Chi-squared test

data: data
X-squared = 0.86404, df = 2, p-value = 0.6492

Способ интерпретации вывода следующий:

  • Статистика теста хи-квадрат: 0,86404
  • Степени свободы: 2 (рассчитывается как #rows-1 * #columns-1)
  • р-значение: 0,6492

Напомним, что критерий независимости хи-квадрат использует следующие нулевые и альтернативные гипотезы:

  • H 0 : (нулевая гипотеза) Две переменные независимы.
  • H 1 : (альтернативная гипотеза) Две переменные не являются независимыми.

Поскольку p-значение (0,6492) теста не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Другими словами, предпочтения пола и политической партии не зависят друг от друга.

Дополнительные ресурсы

Введение в критерий независимости хи-квадрат
Калькулятор критерия хи-квадрат независимости
Как рассчитать P-значение статистики хи-квадрат в R
Как найти критическое значение хи-квадрат в R