Понимание стандартной ошибки наклона регрессии

Стандартная ошибка наклона регрессии — это способ измерения «неопределенности» в оценке наклона регрессии.

Он рассчитывается как:

формула для стандартной ошибки наклона регрессии

куда:

n : общий размер выборки
y i : фактическое значение переменной ответа
ŷ i : прогнозируемое значение переменной ответа
x i : фактическое значение переменной-предиктора
x̄ : среднее значение переменной-предиктора

Чем меньше стандартная ошибка, тем ниже изменчивость оценки коэффициента наклона регрессии.

Стандартная ошибка наклона регрессии будет отображаться в столбце «стандартная ошибка» в выводе регрессии большинства статистических программ:

В следующих примерах показано, как интерпретировать стандартную ошибку наклона регрессии в двух разных сценариях.

Пример 1. Интерпретация малой стандартной ошибки наклона регрессии

Предположим, профессор хочет понять взаимосвязь между количеством часов обучения и итоговой оценкой на экзамене, полученной студентами в его классе.

Он собирает данные по 25 ученикам и создает следующую диаграмму рассеяния:

Существует четкая положительная связь между двумя переменными. По мере увеличения часов обучения экзаменационный балл увеличивается с довольно предсказуемой скоростью.

Затем он подбирает простую модель линейной регрессии, используя часы обучения в качестве переменной-предиктора и итоговый балл экзамена в качестве переменной-ответа.

В следующей таблице показаны результаты регрессии:

Коэффициент для предикторной переменной «изучаемые часы» равен 5,487. Это говорит нам о том, что каждый дополнительный час обучения связан со средним увеличением экзаменационного балла на 5,487 .

Стандартная ошибка составляет 0,419 , что является мерой изменчивости этой оценки наклона регрессии.

Мы можем использовать это значение для расчета t-статистики для предикторной переменной «изучаемые часы»:

t-статистика = оценка коэффициента / стандартная ошибка
t-статистика = 5,487 / 0,419
t-статистика = 13,112

Значение p, соответствующее этой тестовой статистике, равно 0,000, что указывает на то, что «отработанные часы» имеют статистически значимую связь с итоговой оценкой экзамена.

Поскольку стандартная ошибка наклона регрессии была небольшой по сравнению с оценкой коэффициента наклона регрессии, переменная-предиктор была статистически значимой.

Пример 2. Интерпретация большой стандартной ошибки наклона регрессии

Предположим, другой профессор хочет понять взаимосвязь между количеством часов обучения и итоговой оценкой на экзамене, полученной студентами в ее классе.

Она собирает данные по 25 ученикам и создает следующую диаграмму рассеяния:

По-видимому, существует небольшая положительная связь между двумя переменными. По мере увеличения часов обучения экзаменационная оценка обычно увеличивается, но не с предсказуемой скоростью.

Предположим, что затем профессор подбирает простую модель линейной регрессии, используя часы обучения в качестве переменной-предиктора и итоговый балл экзамена в качестве переменной-ответа.

В следующей таблице показаны результаты регрессии:

Коэффициент для предикторной переменной «изучаемые часы» равен 1,7919. Это говорит нам о том, что каждый дополнительный час обучения связан со средним увеличением экзаменационного балла на 1,7919 .

Стандартная ошибка составляет 1,0675 , что является мерой изменчивости этой оценки наклона регрессии.

Мы можем использовать это значение для расчета t-статистики для предикторной переменной «изучаемые часы»:

t-статистика = оценка коэффициента / стандартная ошибка
t-статистика = 1,7919/1,0675
t-статистика = 1,678

Значение p, соответствующее этой тестовой статистике, равно 0,107. Поскольку это p-значение не меньше 0,05, это указывает на то, что «учебные часы» не имеют статистически значимой связи с итоговой оценкой экзамена.

Поскольку стандартная ошибка наклона регрессии была большой по сравнению с оценкой коэффициента наклона регрессии, предикторная переменная не была статистически значимой.

Дополнительные ресурсы

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как читать и интерпретировать таблицу регрессии

Понимание стандартной ошибки наклона регрессии

Пример 1. Интерпретация малой стандартной ошибки наклона регрессии

Пример 2. Интерпретация большой стандартной ошибки наклона регрессии

Дополнительные ресурсы

Редакция Кодкампа