Как добавить уравнение регрессии на график в R


Часто вам может понадобиться добавить уравнение регрессии к графику в R следующим образом:

К счастью, это довольно легко сделать с помощью функций из пакетов ggplot2 и ggpubr .

В этом руководстве представлен пошаговый пример того, как использовать функции из этих пакетов для добавления уравнения регрессии на график в R.

Шаг 1: Создайте данные

Во-первых, давайте создадим некоторые поддельные данные для работы:

#make this example reproducible
set. seed (1)

#create data frame
df <- data.frame(x = c(1:100))
df$y <- 4\*df$x + rnorm(100, sd=20)

#view head of data frame
head(df)

 x y
1 1 -8.529076
2 2 11.672866
3 3 -4.712572
4 4 47.905616
5 5 26.590155
6 6 7.590632

Шаг 2: Создайте график с уравнением регрессии

Далее мы будем использовать следующий синтаксис для создания диаграммы рассеяния с подобранной линией регрессии и уравнением:

#load necessary libraries
library (ggplot2)
library (ggpubr)

#create plot with regression line and regression equation
ggplot(data=df, aes (x=x, y=y)) +
 geom_smooth(method=" lm ") +
 geom_point() +
 stat_regline_equation(label. x =30, label. y =310) 

Это говорит нам о том, что подобранное уравнение регрессии:

у = 2,6 + 4*(х)

Обратите внимание, что label.x и label.y задают координаты (x,y) для отображаемого уравнения регрессии.

Шаг 3: добавьте R-квадрат на график (необязательно)

Вы также можете добавить значение R-квадрата регрессионной модели, если хотите использовать следующий синтаксис:

#load necessary libraries
library (ggplot2)
library (ggpubr)

#create plot with regression line, regression equation, and R-squared
ggplot(data=df, aes (x=x, y=y)) +
 geom_smooth(method=" lm ") +
 geom_point() +
 stat_regline_equation(label. x =30, label. y =310) +
        stat_cor( aes (label=..rr.label..), label. x =30, label. y =290) 

R-квадрат для этой модели оказывается равным 0,98 .


Вы можете найти больше руководств по R на этой странице .