Как выполнить тест независимости хи-квадрат в Excel


Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.

В этом руководстве объясняется, как выполнить критерий независимости хи-квадрат в Excel.

Пример: критерий независимости хи-квадрат в Excel

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:

Используйте следующие шаги, чтобы выполнить тест независимости Хи-квадрат, чтобы определить, связан ли пол с предпочтениями политической партии.

Шаг 1: Определите гипотезы.

Мы проведем критерий независимости Хи-квадрат, используя следующие гипотезы:

  • H 0 : Пол и предпочтения политической партии не зависят друг от друга.
  • H 1 : Пол и предпочтение политической партии не являются независимыми.

Шаг 2: Рассчитайте ожидаемые значения.

Далее мы рассчитаем ожидаемые значения для каждой ячейки в таблице непредвиденных обстоятельств, используя следующую формулу:

Ожидаемое значение = (сумма строк * сумма столбцов) / сумма таблицы.

Например, ожидаемое значение для мужчин-республиканцев: (230*250) / 500 = 115 .

Мы можем повторить эту формулу, чтобы получить ожидаемое значение для каждой ячейки в таблице:


Шаг 3: Рассчитайте (OE) 2 / E для каждой ячейки таблицы.

Далее мы рассчитаем (OE) 2 / E для каждой ячейки в таблице, где:

  • O: наблюдаемое значение
  • E: ожидаемое значение

Например, республиканцы-мужчины будут иметь значение: (120-115) 2 /115 = 0,2174 .

Мы можем повторить эту формулу для каждой ячейки в таблице:

Шаг 4: Рассчитайте тестовую статистику X 2 и соответствующее значение p.

Тестовая статистика X 2 представляет собой просто сумму значений в последней таблице.

Значение p, соответствующее тестовой статистике X 2 , можно найти по формуле:

=CHISQ.DIST.RT(x, степень_свободы)

куда:

  • x: тестовая статистика X 2
  • deg_freedom: степени свободы, рассчитываемые как (#rows-1) * (#columns-1)

Тестовая статистика X 2 оказывается равной 0,8640 , а соответствующее значение p равно 0,649198 .

Шаг 5: Сделайте вывод.

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Примечание. Вы также можете выполнить весь этот тест, используя Калькулятор критерия независимости хи-квадрат .