Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.
В этом руководстве объясняется, как выполнить критерий независимости хи-квадрат в Excel.
Пример: критерий независимости хи-квадрат в Excel
Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:

Используйте следующие шаги, чтобы выполнить тест независимости Хи-квадрат, чтобы определить, связан ли пол с предпочтениями политической партии.
Шаг 1: Определите гипотезы.
Мы проведем критерий независимости Хи-квадрат, используя следующие гипотезы:
- H 0 : Пол и предпочтения политической партии не зависят друг от друга.
- H 1 : Пол и предпочтение политической партии не являются независимыми.
Шаг 2: Рассчитайте ожидаемые значения.
Далее мы рассчитаем ожидаемые значения для каждой ячейки в таблице непредвиденных обстоятельств, используя следующую формулу:
Ожидаемое значение = (сумма строк * сумма столбцов) / сумма таблицы.
Например, ожидаемое значение для мужчин-республиканцев: (230*250) / 500 = 115 .
Мы можем повторить эту формулу, чтобы получить ожидаемое значение для каждой ячейки в таблице:

Шаг 3: Рассчитайте (OE) 2 / E для каждой ячейки таблицы.
Далее мы рассчитаем (OE) 2 / E для каждой ячейки в таблице, где:
- O: наблюдаемое значение
- E: ожидаемое значение
Например, республиканцы-мужчины будут иметь значение: (120-115) 2 /115 = 0,2174 .
Мы можем повторить эту формулу для каждой ячейки в таблице:

Шаг 4: Рассчитайте тестовую статистику X 2 и соответствующее значение p.
Тестовая статистика X 2 представляет собой просто сумму значений в последней таблице.
Значение p, соответствующее тестовой статистике X 2 , можно найти по формуле:
=CHISQ.DIST.RT(x, степень_свободы)
куда:
- x: тестовая статистика X 2
- deg_freedom: степени свободы, рассчитываемые как (#rows-1) * (#columns-1)
Тестовая статистика X 2 оказывается равной 0,8640 , а соответствующее значение p равно 0,649198 .

Шаг 5: Сделайте вывод.
Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.
Примечание. Вы также можете выполнить весь этот тест, используя Калькулятор критерия независимости хи-квадрат .