Как создать графики с добавленными переменными в R

Как создать графики с добавленными переменными в R

В статистике графики добавленных переменных представляют собой отдельные графики, которые отображают взаимосвязь между переменной отклика и одной переменной-предиктором в модели множественной линейной регрессии, при этом контролируя наличие других переменных-предикторов в модели.

Примечание. Иногда эти графики также называют «графиками частичной регрессии».

Эти типы графиков позволяют нам наблюдать взаимосвязь между каждой отдельной переменной-предиктором и переменной отклика в модели, сохраняя при этом другие переменные-предикторы постоянными.

Чтобы создать дополнительные графики переменных в R, мы можем использовать функцию avPlots() из пакета car :

#load *car* package
library (car) 

#fit multiple linear regression model
model <- lm(y ~ x1 + x2 + ..., data = df)

#create added variable plots
avPlots(model)

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: добавлены графики переменных в R

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R, используя данные из набора данных mtcars :

#fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)

#view summary of model
summary(model)

Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)

Residuals:
 Min 1Q Median 3Q Max 
-5.1225 -1.8454 -0.4456 1.1342 6.4958 

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 19.344293 6.370882 3.036 0.00513 \*\*
disp -0.019232 0.009371 -2.052 0.04960 \* 
hp -0.031229 0.013345 -2.340 0.02663 \* 
drat 2.714975 1.487366 1.825 0.07863.
---
Signif. codes: 0 ‘\*\*\*’ 0.001 ‘\*\*’ 0.01 ‘\*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09

Чтобы визуализировать взаимосвязь между переменной ответа «миль на галлон» и каждой отдельной переменной-предиктором в модели, мы можем создавать графики с добавленными переменными, используя функцию avPlots() :

#load car package
library (car)

#produce added variable plots
avPlots(model)
Добавлен переменный график в R

Вот как интерпретировать каждый сюжет:

  • На оси X отображается одна предикторная переменная, а на оси Y — переменная отклика.
  • Синяя линия показывает связь между переменной-предиктором и переменной ответа, при этом значение всех остальных переменных-предикторов остается постоянным .
  • Точки, отмеченные на каждом графике, представляют два наблюдения с наибольшими остатками и два наблюдения с наибольшим частичным рычагом.

Обратите внимание, что угол линии на каждом графике соответствует знаку коэффициента из расчетного уравнения регрессии.

Например, вот оценочные коэффициенты для каждой предикторной переменной из модели:

  • дисп : -0,019232
  • л.с.: -0,031229
  • цена: 2.714975

Обратите внимание, что угол линии положительный на графике добавленной переменной для drat и отрицательный для disp и hp , что соответствует знакам их оценочных коэффициентов:

Как интерпретировать графики добавленных переменных

Эти графики позволяют нам удобно визуализировать взаимосвязь между каждой отдельной переменной предиктора и переменной отклика.

Дополнительные ресурсы

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как выполнить логистическую регрессию в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.