Хи-квадрат Проверка соответствия в Google Таблицах (шаг за шагом)


Хи-квадрат критерий согласия используется для определения того, следует ли категориальная переменная гипотетическому распределению.

Например, предположим, что владелец магазина утверждает, что каждый будний день в его магазин заходит одинаковое количество покупателей.

Чтобы проверить эту гипотезу, независимый исследователь записывает количество покупателей, которые заходят в магазин на определенной неделе, и обнаруживает следующее:

  • Понедельник: 50 клиентов
  • вторник: 60 клиентов
  • Среда: 40 клиентов
  • Четверг: 47 клиентов
  • Пятница: 53 клиента

Мы можем выполнить критерий согласия Хи-квадрат, чтобы определить, согласуются ли данные с заявлением владельца магазина.

В следующем пошаговом примере показано, как выполнить критерий согласия хи-квадрат в Google Таблицах.

Шаг 1: Создайте данные

Во-первых, давайте введем данные в Google Таблицы в следующем формате:

Примечание. Всего было 250 клиентов. Если владелец магазина ожидает, что каждый день в магазин будет приходить одинаковое количество покупателей, то он ожидает 50 покупателей в день.

Шаг 2. Рассчитайте разницу между наблюдаемыми и ожидаемыми значениями.

Статистика критерия хи-квадрат для теста согласия равна X 2 = Σ(OE) 2 / E

куда:

  • Σ: причудливый символ, означающий «сумма».
  • O: наблюдаемое значение
  • E: ожидаемое значение

Следующая формула показывает, как рассчитать (OE) 2 / E для каждой строки:

Шаг 3: Рассчитайте P-значение

Наконец, мы рассчитаем статистику теста хи-квадрат вместе с соответствующим значением p, используя следующие формулы:

Примечание.Функция CHISQ.DIST.RT(x, deg_freedom) возвращает правостороннюю вероятность распределения хи-квадрат, связанную с тестовой статистикой x и определенными степенями свободы. Степени свободы рассчитываются как n-1. В этом случае deg_freedom = 5 – 1 = 4.

Статистика теста X 2 для теста составляет 4,36 , а соответствующее значение p равно 0,3595 .

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что истинное распределение покупателей отличается от распределения, о котором заявил владелец магазина.

Дополнительные ресурсы

Введение в критерий пригодности хи-квадрат
Хи-квадрат Калькулятор критерия согласия
Объяснение P-значений и статистической значимости