Часто вам может понадобиться добавить уравнение регрессии к графику в R следующим образом:

К счастью, это довольно легко сделать с помощью функций из пакетов ggplot2 и ggpubr .
В этом руководстве представлен пошаговый пример того, как использовать функции из этих пакетов для добавления уравнения регрессии на график в R.
Шаг 1: Создайте данные
Во-первых, давайте создадим некоторые поддельные данные для работы:
#make this example reproducible
set. seed (1)
#create data frame
df <- data.frame(x = c(1:100))
df$y <- 4\*df$x + rnorm(100, sd=20)
#view head of data frame
head(df)
x y
1 1 -8.529076
2 2 11.672866
3 3 -4.712572
4 4 47.905616
5 5 26.590155
6 6 7.590632
Шаг 2: Создайте график с уравнением регрессии
Далее мы будем использовать следующий синтаксис для создания диаграммы рассеяния с подобранной линией регрессии и уравнением:
#load necessary libraries
library (ggplot2)
library (ggpubr)
#create plot with regression line and regression equation
ggplot(data=df, aes (x=x, y=y)) +
geom_smooth(method=" lm ") +
geom_point() +
stat_regline_equation(label. x =30, label. y =310)

Это говорит нам о том, что подобранное уравнение регрессии:
у = 2,6 + 4*(х)
Обратите внимание, что label.x и label.y задают координаты (x,y) для отображаемого уравнения регрессии.
Шаг 3: добавьте R-квадрат на график (необязательно)
Вы также можете добавить значение R-квадрата регрессионной модели, если хотите использовать следующий синтаксис:
#load necessary libraries
library (ggplot2)
library (ggpubr)
#create plot with regression line, regression equation, and R-squared
ggplot(data=df, aes (x=x, y=y)) +
geom_smooth(method=" lm ") +
geom_point() +
stat_regline_equation(label. x =30, label. y =310) +
stat_cor( aes (label=..rr.label..), label. x =30, label. y =290)

R-квадрат для этой модели оказывается равным 0,98 .
Вы можете найти больше руководств по R на этой странице .