Криволинейная регрессия — это название, данное любой модели регрессии, которая пытается подогнать кривую , а не прямую линию.
Общие примеры моделей криволинейной регрессии включают:
Квадратичная регрессия: используется, когда существует квадратичная связь между переменной-предиктором и переменной- откликом.На графике этот тип отношений выглядит как буква «U» или перевернутая буква «U» на диаграмме рассеивания:

Кубическая регрессия: используется, когда существует кубическая связь между переменной-предиктором и переменной-ответом. На графике этот тип отношений имеет две отдельные кривые на диаграмме рассеяния:

Оба они отличаются от простой линейной регрессии , в которой связь между переменной-предиктором и переменной-ответом является линейной:

Формула моделей криволинейной регрессии
Простая модель линейной регрессии пытается подобрать набор данных, используя следующую формулу:
ŷ = β 0 + β 1 х
куда:
- ŷ: переменная отклика
- β 0 , β 1 : Коэффициенты регрессии
- x: предикторная переменная
Напротив, модель квадратичной регрессии использует следующую формулу:
ŷ = β 0 + β 1 х + β 2 х 2
Модель кубической регрессии использует следующую формулу:
ŷ = β 0 + β 1 х + β 2 х 2 + β 3 х 3
Более общее название регрессионных моделей, включающих экспоненты, — полиномиальная регрессия , которая принимает следующую формулу:
ŷ = β 0 + β 1 x + β 2 x 2 + … + β k x k
Значение k указывает степень многочлена. Хотя степень может быть любым положительным числом, на практике мы редко подбираем модели полиномиальной регрессии со степенью выше 3 или 4.
Используя экспоненты в формуле модели регрессии, модели полиномиальной регрессии могут подгонять кривые к наборам данных вместо прямых линий.
Когда использовать криволинейную регрессию
Самый простой способ узнать, следует ли вам использовать криволинейную регрессию, — это создать диаграмму рассеяния переменной-предиктора и переменной-ответа.
Если диаграмма рассеивания отображает линейную зависимость между двумя переменными, то, вероятно, целесообразно использовать простую линейную регрессию.
Однако, если диаграмма рассеяния показывает квадратичную, кубическую или какую-либо другую криволинейную закономерность между предиктором и переменной отклика, то криволинейная регрессия, вероятно, более уместна.
Вы также можете подобрать простую модель линейной регрессии и модель криволинейной регрессии и сравнить скорректированные значения R-квадрата каждой модели, чтобы определить, какая модель лучше подходит для данных.
Скорректированный R-квадрат полезен, потому что он сообщает вам долю дисперсии в переменной отклика, которая может быть объяснена предикторной переменной (переменными), с поправкой на количество предикторных переменных в модели.
В целом, модель с более высоким скорректированным значением R-квадрата лучше соответствует набору данных.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять полиномиальную регрессию в различных статистических программах:
Введение в полиномиальную регрессию
Как выполнить полиномиальную регрессию в Excel
Как выполнить полиномиальную регрессию в Python
Как выполнить полиномиальную регрессию в R