Что такое криволинейная регрессия? (Определение и примеры)

Что такое криволинейная регрессия? (Определение и примеры)

Криволинейная регрессия — это название, данное любой модели регрессии, которая пытается подогнать кривую , а не прямую линию.

Общие примеры моделей криволинейной регрессии включают:

Квадратичная регрессия: используется, когда существует квадратичная связь между переменной-предиктором и переменной- откликом.На графике этот тип отношений выглядит как буква «U» или перевернутая буква «U» на диаграмме рассеивания:

Кубическая регрессия: используется, когда существует кубическая связь между переменной-предиктором и переменной-ответом. На графике этот тип отношений имеет две отдельные кривые на диаграмме рассеяния:

Оба они отличаются от простой линейной регрессии , в которой связь между переменной-предиктором и переменной-ответом является линейной:

Формула моделей криволинейной регрессии

Простая модель линейной регрессии пытается подобрать набор данных, используя следующую формулу:

ŷ = β 0 + β 1 х

куда:

  • ŷ: переменная отклика
  • β 0 , β 1 : Коэффициенты регрессии
  • x: предикторная переменная

Напротив, модель квадратичной регрессии использует следующую формулу:

ŷ = β 0 + β 1 х + β 2 х 2

Модель кубической регрессии использует следующую формулу:

ŷ = β 0 + β 1 х + β 2 х 2 + β 3 х 3

Более общее название регрессионных моделей, включающих экспоненты, — полиномиальная регрессия , которая принимает следующую формулу:

ŷ = β 0 + β 1 x + β 2 x 2 + … + β k x k

Значение k указывает степень многочлена. Хотя степень может быть любым положительным числом, на практике мы редко подбираем модели полиномиальной регрессии со степенью выше 3 или 4.

Используя экспоненты в формуле модели регрессии, модели полиномиальной регрессии могут подгонять кривые к наборам данных вместо прямых линий.

Когда использовать криволинейную регрессию

Самый простой способ узнать, следует ли вам использовать криволинейную регрессию, — это создать диаграмму рассеяния переменной-предиктора и переменной-ответа.

Если диаграмма рассеивания отображает линейную зависимость между двумя переменными, то, вероятно, целесообразно использовать простую линейную регрессию.

Однако, если диаграмма рассеяния показывает квадратичную, кубическую или какую-либо другую криволинейную закономерность между предиктором и переменной отклика, то криволинейная регрессия, вероятно, более уместна.

Вы также можете подобрать простую модель линейной регрессии и модель криволинейной регрессии и сравнить скорректированные значения R-квадрата каждой модели, чтобы определить, какая модель лучше подходит для данных.

Скорректированный R-квадрат полезен, потому что он сообщает вам долю дисперсии в переменной отклика, которая может быть объяснена предикторной переменной (переменными), с поправкой на количество предикторных переменных в модели.

В целом, модель с более высоким скорректированным значением R-квадрата лучше соответствует набору данных.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять полиномиальную регрессию в различных статистических программах:

Введение в полиномиальную регрессию
Как выполнить полиномиальную регрессию в Excel
Как выполнить полиномиальную регрессию в Python
Как выполнить полиномиальную регрессию в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.