Полиномиальная регрессия в Google Sheets (шаг за шагом)

Полиномиальная регрессия в Google Sheets (шаг за шагом)

Регрессионный анализ используется для количественной оценки взаимосвязи между одной или несколькими переменными-предикторами и переменной отклика .

Наиболее распространенным типом регрессионного анализа является простая линейная регрессия , которая используется, когда переменная-предиктор и переменная-отклик имеют линейную связь.

Линейная связь между двумя переменными

Однако иногда связь между переменной-предиктором и переменной-ответом нелинейна.

Пример квадратичной зависимости
Пример кубической связи

В этих случаях имеет смысл использовать полиномиальную регрессию , которая может учитывать нелинейную связь между переменными.

В этом руководстве представлен пошаговый пример выполнения полиномиальной регрессии в Google Таблицах.

Шаг 1: Создайте данные

Во-первых, давайте создадим поддельный набор данных со следующими значениями:

Шаг 2: Создайте диаграмму рассеивания

Далее мы создадим диаграмму рассеяния для визуализации данных.

Сначала выделите ячейки A2: B11 следующим образом:

Затем перейдите на вкладку « Вставка », а затем нажмите « Диаграмма » в раскрывающемся меню:

По умолчанию Google Таблицы вставят диаграмму рассеяния:

Шаг 3: Найдите уравнение полиномиальной регрессии

Затем дважды щелкните в любом месте диаграммы рассеяния, чтобы открыть окно редактора диаграмм справа:

Затем нажмите Серия.Затем прокрутите вниз и установите флажок рядом с линией тренда и измените тип на полиномиальный.В поле «Метка» выберите « Использовать формулу », а затем установите флажок « Показать R 2 » .

Это приведет к отображению следующей формулы над диаграммой рассеяния:

Полиномиальная регрессия в Google Sheets

Мы можем видеть, что подобранное уравнение полиномиальной регрессии:

у = 9,45 + 2,1х – 0,0188х 2

R-квадрат для этой модели равен 0,718 .

Напомним, что R-квадрат говорит нам о проценте вариации переменной отклика, которую можно объяснить переменными-предикторами. Чем выше значение, тем лучше модель.

Затем измените степень полинома на 3 в редакторе диаграмм:

Изменение степени полинома в Google Sheets

Это приведет к отображению следующей формулы над диаграммой рассеяния:

Кубическая регрессия в Google Sheets

Это приводит к тому, что подобранное уравнение полиномиальной регрессии изменяется на:

у = 37,2 - 14,2 х + 2,64 х 2 - 0,126 х 3

R-квадрат для этой модели равен 0,976 .

Обратите внимание, что R-квадрат для этой модели значительно выше, чем у модели полиномиальной регрессии со степенью 2. Это говорит о том, что эта модель регрессии значительно лучше фиксирует тенденцию в базовых данных.

Если вы измените степень полинома на 4, R-квадрат увеличится лишь до 0,981.Это говорит о том, что модели полиномиальной регрессии со степенью 3 достаточно, чтобы зафиксировать тенденцию для этих данных.

Мы можем использовать подобранное уравнение регрессии, чтобы найти ожидаемое значение переменной ответа на основе заданного значения переменной-предиктора. Например, если x = 4, то ожидаемое значение y будет следующим:

у = 37,2 – 14,2(4) + 2,64(4) 2 – 0,126(4) 3 = 14,576


Вы можете найти больше руководств по Google Таблицам на этой странице .

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.