График остатков — это тип графика, который отображает значения переменной-предиктора в регрессионной модели по оси x и значения остатков по оси y.
![](https://www.codecamp.ru/content/images/2021/05/residHand2.png)
Этот график используется для оценки того, нормально ли распределены остатки в регрессионной модели и проявляют ли они гетероскедастичность .
В следующем пошаговом примере показано, как вручную создать график остатков для регрессионной модели.
Шаг 1: Найдите прогнозируемые значения
Предположим, мы хотим подогнать модель регрессии к следующему набору данных:
![](https://www.codecamp.ru/content/images/2021/05/residHand1.png)
Используя статистическое программное обеспечение (например, Excel, R, Python, SPSS и т. д.), мы можем найти, что подобранная модель регрессии:
у = 10,4486 + 1,3037 (х)
Затем мы можем использовать эту модель для прогнозирования значения y на основе значения x. Например, если x = 3, то мы можем предсказать, что y будет:
у = 10,4486 + 1,3037(3) = 14,359
Мы можем повторить этот процесс для каждого наблюдения в нашем наборе данных:
![](https://www.codecamp.ru/content/images/2021/05/residHand3.png)
Шаг 2: Найдите остатки
Остаток для данного наблюдения в нашем наборе данных рассчитывается как:
Остаток = наблюдаемое значение – прогнозируемое значение
Например, остаток первого наблюдения будет рассчитываться как:
Остаток = 15 – 14,359 = 0,641
Мы можем повторить этот процесс для каждого наблюдения в нашем наборе данных:
![](https://www.codecamp.ru/content/images/2021/05/residHand4.png)
Шаг 3: Создайте остаточный график
Наконец, мы можем создать остаточный график, разместив значения x по оси x и остаточные значения по оси y.
Например, первая точка, которую мы поместим на наш график, это (3, 0,641).
![](https://www.codecamp.ru/content/images/2021/05/residHand5.png)
Следующая точка, которую мы поместим на наш график, это (5, 0,033).
![](https://www.codecamp.ru/content/images/2021/05/residHand6.png)
Мы будем продолжать, пока не разместим на графике все 10 парных комбинаций значений x и остаточных значений:
![](https://www.codecamp.ru/content/images/2021/05/residHand2.png)
Любая точка выше нуля на графике представляет собой положительную невязку. Это означает, что наблюдаемое значение y больше, чем значение, предсказанное регрессионной моделью.
Любая точка ниже нуля представляет собой отрицательную невязку. Это означает, что наблюдаемое значение y меньше значения, предсказанного регрессионной моделью.
![Остаточный участок, созданный вручную](https://www.codecamp.ru/content/images/2021/05/residHand7.png)
Поскольку точки на графике случайным образом разбросаны вокруг остаточного значения 0 без четкой закономерности, это указывает на то, что связь между x и y является линейной и подходит для использования модель линейной регрессии.
А поскольку остатки не увеличиваются и не уменьшаются систематически по мере увеличения переменной-предиктора, это означает, что гетероскедастичность не является проблемой для этой регрессионной модели.
Дополнительные ресурсы
В следующих учебных пособиях объясняется, как создавать остаточные графики с использованием различных статистических программ:
Как построить график остатков на калькуляторе TI-84
Как создать остаточный график в Excel
Как создать остаточный график в R
Как создать остаточный график в Python