Как выполнить квадратичную регрессию в Stata

Как выполнить квадратичную регрессию в Stata

Когда две переменные имеют линейную связь, вы часто можете использовать простую линейную регрессию для количественной оценки их связи.

Пример линейной зависимости

Однако, когда две переменные имеют квадратичную связь, вы можете вместо этого использовать квадратичную регрессию для количественной оценки их связи.

Пример квадратичной зависимости

В этом руководстве объясняется, как выполнить квадратичную регрессию в Stata.

Пример: квадратичная регрессия в Stata

Предположим, нам интересно понять взаимосвязь между количеством отработанных часов и счастьем. У нас есть следующие данные о количестве отработанных часов в неделю и сообщаемом уровне счастья (по шкале от 0 до 100) для 16 разных людей:

Набор данных квадратичной регрессии в Stata

Вы можете воспроизвести этот пример, введя эти точные данные в Stata, используя Данные > Редактор данных > Редактор данных (Редактировать) в верхнем меню.

Используйте следующие шаги, чтобы выполнить квадратичную регрессию в Stata.

Шаг 1: Визуализируйте данные.

Прежде чем мы сможем использовать квадратичную регрессию, нам нужно убедиться, что связь между объясняющей переменной (часами) и переменной отклика (счастьем) на самом деле является квадратичной. Итак, давайте визуализируем данные с помощью диаграммы рассеяния , введя следующее в поле «Команда»:

разбрасывать часы счастья

Получается следующая диаграмма рассеяния:

Квадратичная диаграмма рассеяния в Stata

Мы можем видеть, что счастье имеет тенденцию увеличиваться по мере увеличения количества отработанных часов от нуля до определенного момента, но затем начинает падать ниже, когда количество отработанных часов превышает примерно 30.

Эта перевернутая буква «U» на диаграмме рассеяния указывает на то, что существует квадратичная зависимость между отработанными часами и счастьем, а это означает, что мы должны использовать квадратичную регрессию для количественной оценки этой зависимости.

Шаг 2: Выполните квадратичную регрессию.

Прежде чем мы подгоним модель квадратичной регрессии к данным, нам нужно создать новую переменную для квадратов значений нашей переменной-предиктора hours.Мы можем сделать это, введя следующее в поле Command:

генератор часов2 = часы*часы

Мы можем просмотреть эту новую переменную, перейдя в « Данные»> «Редактор данных»> «Редактор данных (обзор) » в верхнем меню.

Квадратичная регрессия в Stata

Мы видим, что часы2 — это просто часы в квадрате. Теперь мы можем выполнить квадратичную регрессию, используя часы и часы2 в качестве объясняющих переменных и счастье в качестве переменной отклика. Чтобы выполнить квадратичную регрессию, введите следующее в поле «Команда»:

регресс часы счастья часы2
Вывод квадратичной регрессии в Stata

Вот как интерпретировать наиболее интересные числа в выводе:

Вероятность > F: 0,000. Это p-значение для общей регрессии. Поскольку это значение меньше 0,05, это означает, что предикторные переменные часы и часы 2 вместе взятые имеют статистически значимую связь с переменной-откликом счастьем .

R-квадрат: 0,9092. Это доля дисперсии переменной отклика, которая может быть объяснена объясняющей переменной. В этом примере 90,92% вариаций счастья можно объяснить часами и часами 2 .

Уравнение регрессии: мы можем составить уравнение регрессии, используя значения коэффициентов, указанные в выходной таблице. В этом случае уравнение будет таким:

предсказанное счастье = -30,25287 + 7,173061 (часы) – 0,1069887 (часы 2 )

Мы можем использовать это уравнение, чтобы найти прогнозируемое счастье человека, учитывая количество часов, которые он работает в неделю.

Например, прогнозируется, что человек, который работает 60 часов в неделю, будет иметь уровень счастья 14,97:

предсказанное счастье = -30,25287 + 7,173061(60) – 0,1069887(60 2 ) = 14,97 .

И наоборот, человек, который работает 30 часов в неделю, по прогнозам, будет иметь уровень счастья 88,65:

предсказанное счастье = -30,25287 + 7,173061(30) – 0,1069887(30 2 ) = 88,65 .

Шаг 3: Сообщите о результатах.

Наконец, мы хотим сообщить о результатах нашей квадратичной регрессии. Вот пример того, как это сделать:

Квадратичная регрессия была проведена для количественной оценки взаимосвязи между количеством часов, отработанных человеком, и соответствующим ему уровнем счастья (измеряется от 0 до 100). Для анализа использовалась выборка из 16 человек.
Результаты показали, что существует статистически значимая связь между объясняющими переменными часами и часами 2 и переменной счастья (F (2, 13) = 65,09, p < 0,0001).
Вместе эти две объясняющие переменные составляли 90,92% объясненной изменчивости счастья.
Уравнение регрессии оказалось таким:
предсказанное счастье = -30,25287 + 7,173061 (часы) – 0,1069887 (часы 2 )
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.