Одно из ключевых предположений линейной регрессии состоит в том, что остатки распределяются с одинаковой дисперсией на каждом уровне предиктора. Это предположение известно как гомоскедастичность .
Когда это предположение нарушается, говорят, что в остатках присутствует гетероскедастичность.Когда это происходит, результаты регрессии становятся ненадежными.
Один из способов визуально определить, присутствует ли гетероскедастичность, состоит в том, чтобы построить график остатков в зависимости от подогнанных значений регрессионной модели.
Если остатки становятся более разбросанными при более высоких значениях на графике, это явный признак наличия гетероскедастичности.
![Пример гетероскедастичности для теста Бреуша-Пагана](https://www.codecamp.ru/content/images/2020/12/het2.jpg)
Формальный статистический тест, который мы можем использовать для определения наличия гетероскедастичности, — это тест Бреуша-Пагана .
Этот учебник содержит краткое объяснение теста Бреуша-Пагана вместе с примером.
Что такое тест Бреуша-Пагана?
Тест Бреуша-Пагана используется для определения наличия или отсутствия гетероскедастичности в регрессионной модели.
В тесте используются следующие нулевая и альтернативная гипотезы :
- Нулевая гипотеза (H 0 ): присутствует гомоскедастичность (остатки распределены с равной дисперсией)
- Альтернативная гипотеза ( HA ): присутствует гетероскедастичность (остатки не распределены с одинаковой дисперсией)
Если p-значение теста меньше некоторого уровня значимости (т. е. α = 0,05), то мы отклоняем нулевую гипотезу и делаем вывод, что в регрессионной модели присутствует гетероскедастичность.
Мы используем следующие шаги для выполнения теста Бреуша-Пагана:
1. Подберите регрессионную модель.
2. Рассчитайте квадраты невязок модели.
3. Подберите новую модель регрессии, используя квадраты невязок в качестве значений отклика.
4. Рассчитайте статистику критерия хи-квадрат X 2 как n*R 2 new , где:
- n: общее количество наблюдений
- R 2 new : R-квадрат новой регрессионной модели, в которой в качестве значений отклика использовались квадраты остатков.
Если значение p, соответствующее этой статистике критерия хи-квадрат с p (число предикторов) степеней свободы, меньше некоторого уровня значимости (т. е. α = 0,05), то нулевая гипотеза отвергается и делается вывод о наличии гетероскедастичности.
В противном случае не удастся отвергнуть нулевую гипотезу. В этом случае предполагается наличие гомоскедастичности.
Обратите внимание, что большинство статистических программ могут легко выполнить тест Бреуша-Пагана, поэтому вам, вероятно, никогда не придется выполнять эти шаги вручную, но полезно знать, что происходит за кулисами.
Пример теста Бреуша-Пагана
Предположим, у нас есть следующий набор данных, содержащий информацию о 10 разных баскетболистах:
![](https://www.codecamp.ru/content/images/2020/12/bp1.png)
Используя статистическое программное обеспечение, мы подогнали следующую модель множественной линейной регрессии :
рейтинг = 62,47 + 1,12*(очки) + 0,88*(передачи) – 0,43*(подборы)
Затем мы используем эту модель для прогнозирования рейтинга каждого игрока и рассчитываем квадраты остатков (т. е. квадрат разницы между прогнозируемым рейтингом и фактическим рейтингом):
![](https://www.codecamp.ru/content/images/2020/12/bp2.png)
Затем мы подгоняем новую модель регрессии, используя квадраты остатков в качестве значений отклика и исходные переменные-предикторы в качестве переменных-предикторов еще раз. Мы находим следующее:
- п: 10
- Р 2 новый : 0,600395
Таким образом, наша статистика критерия хи-квадрат для теста Бреуша-Пагана равна n*R 2 new = 10*0,600395 = 6,00395.Степени свободы - это p = 3 переменных-предиктора.
Согласно Калькулятору хи-квадрат для P-значения , p-значение, соответствующее X 2 = 6,00395 с 3 степенями свободы, составляет 0,111418 .
Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Таким образом, мы предполагаем, что гомоскедастичность присутствует.
Тест Бреуша-Пагана на практике
В следующих руководствах представлены пошаговые примеры выполнения теста Бреуша-Пагана в различных статистических программах:
Как выполнить тест Бреуша-Пагана в Excel
Как выполнить тест Бреуша-Пагана в R
Как выполнить тест Бреуша-Пагана в Python
Как выполнить тест Бреуша-Пагана в Stata