Графики остатков часто используются для оценки того, являются ли остатки в регрессионном анализе нормально распределенными и проявляют ли они гетероскедастичность .
В этом руководстве объясняется, как создавать остаточные графики для регрессионной модели в R.
Пример: остаточные графики в R
В этом примере мы подберем регрессионную модель, используя встроенный набор данных R mtcars, а затем создадим три различных графика остатков для анализа остатков.
Шаг 1: Подберите регрессионную модель.
Во-первых, мы подгоним регрессионную модель, используя mpg в качестве переменной отклика и disp и hp в качестве независимых переменных:
#load the dataset
data(mtcars)
#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)
#get list of residuals
res <- resid(model)
Шаг 2: Создайте невязку по сравнению с подогнанным графиком.
Затем мы создадим график невязок по сравнению с подобранным, который полезен для визуального обнаружения гетероскедастичности, например, систематического изменения разброса невязок в диапазоне значений.
#produce residual vs. fitted plot
plot(fitted(model), res)
#add a horizontal line at 0
abline(0,0)
На оси X отображаются подогнанные значения, а на оси Y — остатки. Из графика видно, что разброс остатков имеет тенденцию быть выше для более высоких подогнанных значений, но он не выглядит достаточно серьезным, чтобы нам нужно было вносить какие-либо изменения в модель.
Шаг 3: Создайте график QQ.
Мы также можем построить график QQ, который полезен для определения того, следуют ли остатки нормальному распределению. Если значения данных на графике располагаются примерно по прямой линии под углом 45 градусов, то данные распределяются нормально.
#create Q-Q plot for residuals
qqnorm(res)
#add a straight diagonal line to the plot
qqline(res)
Мы видим, что остатки имеют тенденцию немного отклоняться от линии возле хвостов, что может указывать на то, что они не распределены нормально.
Шаг 4: Создайте график плотности.
Мы также можем построить график плотности, который также полезен для визуальной проверки того, нормально ли распределены остатки. Если график примерно имеет форму колокола, то остатки, вероятно, следуют нормальному распределению.
#Create density plot of residuals
plot(density(res))
Мы можем видеть, что график плотности примерно повторяет форму колокола, хотя он немного смещен вправо. В зависимости от типа исследования исследователь может или не может решить выполнить преобразование данных, чтобы обеспечить более нормальное распределение остатков.
Дополнительные ресурсы
Как рассчитать стандартизованные остатки в R
Как рассчитать студенческие остатки в R
Как создать гистограмму остатков в R