Как выполнить тест независимости хи-квадрат в Stata

Как выполнить тест независимости хи-квадрат в Stata

Критерий независимости Хи-квадрат используется для определения того, существует ли значительная связь между двумя категориальными переменными.

В этом руководстве объясняется, как выполнить тест независимости хи-квадрат в Stata.

Пример: критерий независимости хи-квадрат в Stata

В этом примере мы будем использовать набор данных auto , который содержит информацию о 74 различных автомобилях 1978 года.

Используйте следующие шаги, чтобы выполнить критерий независимости хи-квадрат, чтобы определить, существует ли значительная связь между следующими двумя переменными:

  • rep78: сколько раз машина ремонтировалась в 1978 году (от 1 до 5)
  • иностранный: является ли тип автомобиля иностранным (0 = нет, 1 = да)

Шаг 1: Загрузите и просмотрите необработанные данные.

Сначала мы загрузим данные, введя следующую команду:

сисус авто

Мы можем просмотреть необработанные данные, введя следующую команду:

бр
Необработанные данные для автоматического набора данных в Stata

Каждая строка отображает информацию для отдельного автомобиля, включая цену, расход топлива, вес, длину и множество других переменных. Единственные две переменные, которые нас интересуют, — это rep78 и Foreign .

Шаг 3: Выполните критерий независимости хи-квадрат.

Мы будем использовать следующий синтаксис для выполнения теста:

вкладка первая_переменная вторая_переменная, чи2

Вот точный синтаксис, который мы будем использовать в нашем случае:

вкладка rep78 иностранный, chi2
Тест Chi-Square независимого вывода в Stata

Вот как интерпретировать вывод:

Сводная таблица: в этой таблице показано общее количество для каждой комбинации rep78 и Foreign.Например

  • Отечественных машин было 2, ремонт 1978 года.
  • Было 8 вагонов отечественного производства, в 1978 году они прошли 2 ремонта.
  • В 1978 году было 27 автомобилей отечественного производства, которые прошли 3 ремонта.

И так далее.

Pearson chisq(4): это статистика теста хи-квадрат для теста. Получается 27.2640.

Pr: это значение p, связанное со статистикой теста хи-квадрат. Получается 0.000. Поскольку это значение меньше 0,05, мы не можем отвергнуть нулевую гипотезу о том, что две переменные независимы. У нас есть достаточно доказательств, чтобы заключить, что существует статистически значимая связь между тем, был ли автомобиль иностранным, и общим количеством ремонтов, которые он получил.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.