Как выполнить тест независимости хи-квадрат в Excel

Как выполнить тест независимости хи-квадрат в Excel

Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.

В этом руководстве объясняется, как выполнить критерий независимости хи-квадрат в Excel.

Пример: критерий независимости хи-квадрат в Excel

Предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:

Таблица непредвиденных обстоятельств в Excel

Используйте следующие шаги, чтобы выполнить тест независимости Хи-квадрат, чтобы определить, связан ли пол с предпочтениями политической партии.

Шаг 1: Определите гипотезы.

Мы проведем критерий независимости Хи-квадрат, используя следующие гипотезы:

  • H 0 : Пол и предпочтения политической партии не зависят друг от друга.
  • H 1 : Пол и предпочтение политической партии не являются независимыми.

Шаг 2: Рассчитайте ожидаемые значения.

Далее мы рассчитаем ожидаемые значения для каждой ячейки в таблице непредвиденных обстоятельств, используя следующую формулу:

Ожидаемое значение = (сумма строк * сумма столбцов) / сумма таблицы.

Например, ожидаемое значение для мужчин-республиканцев: (230*250) / 500 = 115 .

Мы можем повторить эту формулу, чтобы получить ожидаемое значение для каждой ячейки в таблице:

Критерий независимости хи-квадрат в Excel


Шаг 3: Рассчитайте (OE) 2 / E для каждой ячейки таблицы.

Далее мы рассчитаем (OE) 2 / E для каждой ячейки в таблице, где:

  • O: наблюдаемое значение
  • E: ожидаемое значение

Например, республиканцы-мужчины будут иметь значение: (120-115) 2 /115 = 0,2174 .

Мы можем повторить эту формулу для каждой ячейки в таблице:

Тест независимости хи-квадрат в Excel

Шаг 4: Рассчитайте тестовую статистику X 2 и соответствующее значение p.

Тестовая статистика X 2 представляет собой просто сумму значений в последней таблице.

Значение p, соответствующее тестовой статистике X 2 , можно найти по формуле:

=CHISQ.DIST.RT(x, степень_свободы)

куда:

  • x: тестовая статистика X 2
  • deg_freedom: степени свободы, рассчитываемые как (#rows-1) * (#columns-1)

Тестовая статистика X 2 оказывается равной 0,8640 , а соответствующее значение p равно 0,649198 .

Критерий независимости хи-квадрат в Excel

Шаг 5: Сделайте вывод.

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что существует связь между полом и предпочтениями политических партий.

Примечание. Вы также можете выполнить весь этот тест, используя Калькулятор критерия независимости хи-квадрат .

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.