Как читать таблицу распределения хи-квадрат

Как читать таблицу распределения хи-квадрат

В этом руководстве объясняется, как читать и интерпретировать таблицу распределения хи-квадрат .

Что такое таблица распределения хи-квадрат?

Таблица распределения хи-квадрат — это таблица, которая показывает критические значения распределения хи-квадрат. Чтобы использовать таблицу распределения хи-квадрат, вам нужно знать только два значения:

  • Степени свободы для теста хи-квадрат
  • Альфа-уровень для теста (обычно выбираются 0,01, 0,05 и 0,10).

На следующем изображении показаны первые 20 строк таблицы распределения хи-квадрат со степенями свободы в левой части таблицы и альфа-уровнями в верхней части таблицы:

Примечание. Полную таблицу распределения хи-квадрата с большим количеством степеней свободы вы можете найти здесь .

Критические значения в таблице часто сравнивают со статистикой теста Хи-квадрат. Если статистика теста больше критического значения, найденного в таблице, то вы можете отклонить нулевую гипотезу теста хи-квадрат и сделать вывод, что результаты теста статистически значимы.

Примеры использования таблицы распределения хи-квадрат

Мы продемонстрируем, как использовать таблицу распределения хи-квадрат со следующими тремя типами тестов хи-квадрат:

  • Тест хи-квадрат на независимость
  • Тест хи-квадрат на качество подгонки
  • Тест хи-квадрат на однородность

Тест хи-квадрат на независимость

Мы используем тест Хи-квадрат на независимость , когда хотим проверить, существует ли значительная связь между двумя категориальными переменными.

Пример: предположим, мы хотим знать, связан ли пол с предпочтениями политической партии. Мы берем простую случайную выборку из 500 избирателей и опрашиваем их об их предпочтениях в отношении политических партий. Используя уровень значимости 0,05, мы проводим тест хи-квадрат на независимость, чтобы определить, связан ли пол с предпочтениями политической партии. В следующей таблице представлены результаты опроса:

Оказывается, статистика теста для этого теста хи-квадрат составляет 0,864.

Затем мы можем найти критическое значение для теста в таблице распределения хи-квадрат. Степени свободы равны (#rows-1) * (#columns-1) = (2-1) * (3-1) = 2, и проблема подсказала нам, что мы должны использовать альфа-уровень 0,05. Таким образом, по таблице распределения хи-квадрат критическое значение теста равно 5,991 .

Поскольку наша тестовая статистика меньше нашего критического значения, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что существует связь между полом и предпочтениями политических партий.

Тест хи-квадрат на качество подгонки

Мы используем критерий пригодности хи-квадрат , когда хотим проверить, следует ли категориальная переменная гипотетическому распределению.

Пример: Владелец магазина утверждает, что 30 % всех его покупателей на выходных посещают его в пятницу, 50 % — в субботу и 20 % — в воскресенье. Независимый исследователь посещает магазин в случайные выходные и обнаруживает, что 91 покупатель посещает его в пятницу, 104 — в субботу и 65 — в воскресенье. Используя уровень значимости 0,10, мы проводим критерий хи-квадрат на соответствие, чтобы определить, согласуются ли данные с заявлением владельца магазина.

В этом случае тестовая статистика оказывается равной 10,616.

Затем мы можем найти критическое значение для теста в таблице распределения хи-квадрат. Степени свободы равны (#outcomes-1) = 3-1 = 2, и задача подсказала нам, что мы должны использовать альфа-уровень 0,10. Таким образом, по таблице распределения хи-квадрат критическое значение теста равно 4,605 .

Поскольку наша тестовая статистика больше нашего критического значения, мы отклоняем нулевую гипотезу. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что истинное распределение покупателей, заходящих в этот магазин по выходным, не равно 30% в пятницу, 50% в субботу и 20% в воскресенье.

Тест хи-квадрат на однородность

Мы используем тест хи-квадрат на однородность , когда хотим формально проверить, есть ли разница в пропорциях между несколькими группами.

Пример. Баскетбольный тренировочный центр хочет проверить, улучшат ли две новые тренировочные программы долю игроков, прошедших сложный тест по стрельбе. 172 игрока случайным образом распределяются по программе 1, 173 — по программе 2 и 215 — по текущей программе. После использования тренировочных программ в течение одного месяца игроки проходят тест по стрельбе. В таблице ниже показано количество игроков, прошедших тест на стрельбу, в зависимости от того, какую программу они использовали.

Используя уровень значимости 0,05, мы проводим критерий хи-квадрат на однородность, чтобы определить, является ли процент сдачи одинаковым или для каждой тренировочной программы.

Оказывается, статистика теста для этого теста хи-квадрат равна 4,208.

Затем мы можем найти критическое значение для теста в таблице распределения хи-квадрат. Степени свободы равны (#rows-1) * (#columns-1) = (2-1) * (3-1) = 2, и проблема подсказала нам, что мы должны использовать альфа-уровень 0,05. Таким образом, по таблице распределения хи-квадрат критическое значение теста равно 5,991 .

Поскольку наша тестовая статистика меньше нашего критического значения, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что три программы обучения дают разные результаты.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.