Как интерпретировать график масштаба-местоположения (с примерами)

График масштаба-местоположения — это тип графика, на котором отображаются подобранные значения регрессионной модели по оси x и квадратный корень из стандартизированных остатков по оси y.

Глядя на этот график, мы проверяем две вещи:

1. Убедитесь, что красная линия проходит по графику примерно горизонтально. Если это так, то предположение о гомоскедастичности , вероятно, выполняется для данной регрессионной модели. То есть разброс остатков примерно одинаков при всех подобранных значениях.

2. Убедитесь, что среди остатков нет четкой закономерности. Другими словами, остатки должны быть случайным образом разбросаны вокруг красной линии с примерно одинаковой изменчивостью при всех подобранных значениях.

График масштаба-местоположения в R

Мы можем использовать следующий код, чтобы подобрать простую модель линейной регрессии в R и построить график масштабирования для полученной модели:

#fit simple linear regression model
model <- lm(Ozone ~ Temp, data = airquality)

#produce scale-location plot
plot(model)

Мы можем наблюдать следующие две вещи на графике масштаба-местоположения для этой регрессионной модели.

1. Красная линия проходит по графику примерно горизонтально. Если это так, то предположение о гомоскедастичности для данной регрессионной модели выполнено. То есть разброс остатков примерно одинаков при всех подобранных значениях.

Техническое примечание

На графике отмечены три наблюдения из набора данных с самыми высокими стандартизованными остатками.

Мы видим, что наблюдения в строках 30, 62 и 117 имеют самые высокие стандартизованные невязки.

Это не обязательно означает, что эти наблюдения являются выбросами, но вы можете просмотреть исходные данные, чтобы поближе рассмотреть эти наблюдения.

Хотя мы видим, что красная линия примерно горизонтальна на графике масштаб-местоположение, это служит только визуальным способом увидеть, выполняется ли предположение о гомоскедастичности.

Формальный статистический тест, который мы можем использовать, чтобы увидеть, выполняется ли предположение о гомоскедастичности, — этотест Бреуша-Пагана .

Тест Бреуша-Пагана в R

В следующем коде показано, как использовать функцию bptest() из пакета lmtest для выполнения теста Бреуша-Пагана в R:

#load lmtest package
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

 studentized Breusch-Pagan test

data: model
BP = 1.4798, df = 1, p-value = 0.2238

Тест Бреуша-Пагана использует следующие нулевые и альтернативные гипотезы:

Нулевая гипотеза (H 0 ): остатки гомоскедастичны (т. е. равномерно распределены).
Альтернативная гипотеза ( HA ): остатки гетероскедастичны (т. е. неравномерно распределены).

Из вывода мы видим, что p-значение теста равно 0,2238.Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств того, что в регрессионной модели присутствует гетероскедастичность.

Этот результат соответствует нашему визуальному осмотру красной линии на графике масштабирования.

Дополнительные ресурсы

Понимание гетероскедастичности в регрессионном анализе
Как создать остаточный график в R
Как выполнить тест Бреуша-Пагана в R

Как интерпретировать график масштаба-местоположения (с примерами)

График масштаба-местоположения в R

Тест Бреуша-Пагана в R

Дополнительные ресурсы

Редакция Кодкампа