Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.
В этом руководстве объясняется, как выполнить тест независимости хи-квадрат в Stata.
Пример: критерий независимости хи-квадрат в Stata
В этом примере мы будем использовать набор данных auto , который содержит информацию о 74 различных автомобилях 1978 года.
Используйте следующие шаги, чтобы выполнить критерий независимости хи-квадрат, чтобы определить, существует ли значительная связь между следующими двумя переменными:
- rep78: сколько раз машина ремонтировалась в 1978 году (от 1 до 5)
- иностранный: является ли тип автомобиля иностранным (0 = нет, 1 = да)
Шаг 1: Загрузите и просмотрите необработанные данные.
Сначала мы загрузим данные, введя следующую команду:
сисус авто
Мы можем просмотреть необработанные данные, введя следующую команду:
бр
Каждая строка отображает информацию для отдельного автомобиля, включая цену, расход топлива, вес, длину и множество других переменных. Единственные две переменные, которые нас интересуют, — это rep78 и Foreign .
Шаг 3: Выполните критерий независимости хи-квадрат.
Мы будем использовать следующий синтаксис для выполнения теста:
вкладка первая_переменная вторая_переменная, чи2
Вот точный синтаксис, который мы будем использовать в нашем случае:
вкладка rep78 иностранный, chi2
Вот как интерпретировать вывод:
Сводная таблица: в этой таблице показано общее количество для каждой комбинации rep78 и Foreign.Например
- Отечественных машин было 2, ремонт 1978 года.
- Было 8 вагонов отечественного производства, в 1978 году они прошли 2 ремонта.
- В 1978 году было 27 автомобилей отечественного производства, которые прошли 3 ремонта.
И так далее.
Pearson chisq(4): это статистика теста хи-квадрат для теста. Получается 27.2640.
Pr: это значение p, связанное со статистикой теста хи-квадрат. Получается 0.000. Поскольку это значение меньше 0,05, мы не можем отвергнуть нулевую гипотезу о том, что две переменные независимы. У нас есть достаточно доказательств, чтобы заключить, что существует статистически значимая связь между тем, был ли автомобиль иностранным, и общим количеством ремонтов, которые он получил.