Как выполнить тест независимости хи-квадрат в Stata


Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.

В этом руководстве объясняется, как выполнить тест независимости хи-квадрат в Stata.

Пример: критерий независимости хи-квадрат в Stata

В этом примере мы будем использовать набор данных auto , который содержит информацию о 74 различных автомобилях 1978 года.

Используйте следующие шаги, чтобы выполнить критерий независимости хи-квадрат, чтобы определить, существует ли значительная связь между следующими двумя переменными:

  • rep78: сколько раз машина ремонтировалась в 1978 году (от 1 до 5)
  • иностранный: является ли тип автомобиля иностранным (0 = нет, 1 = да)

Шаг 1: Загрузите и просмотрите необработанные данные.

Сначала мы загрузим данные, введя следующую команду:

сисус авто

Мы можем просмотреть необработанные данные, введя следующую команду:

бр

Каждая строка отображает информацию для отдельного автомобиля, включая цену, расход топлива, вес, длину и множество других переменных. Единственные две переменные, которые нас интересуют, — это rep78 и Foreign .

Шаг 3: Выполните критерий независимости хи-квадрат.

Мы будем использовать следующий синтаксис для выполнения теста:

вкладка первая_переменная вторая_переменная, чи2

Вот точный синтаксис, который мы будем использовать в нашем случае:

вкладка rep78 иностранный, chi2

Вот как интерпретировать вывод:

Сводная таблица: в этой таблице показано общее количество для каждой комбинации rep78 и Foreign.Например

  • Отечественных машин было 2, ремонт 1978 года.
  • Было 8 вагонов отечественного производства, в 1978 году они прошли 2 ремонта.
  • В 1978 году было 27 автомобилей отечественного производства, которые прошли 3 ремонта.

И так далее.

Pearson chisq(4): это статистика теста хи-квадрат для теста. Получается 27.2640.

Pr: это значение p, связанное со статистикой теста хи-квадрат. Получается 0.000. Поскольку это значение меньше 0,05, мы не можем отвергнуть нулевую гипотезу о том, что две переменные независимы. У нас есть достаточно доказательств, чтобы заключить, что существует статистически значимая связь между тем, был ли автомобиль иностранным, и общим количеством ремонтов, которые он получил.