Понимание стандартной ошибки наклона регрессии

Понимание стандартной ошибки наклона регрессии

Стандартная ошибка наклона регрессии — это способ измерения «неопределенности» в оценке наклона регрессии.

Он рассчитывается как:

формула для стандартной ошибки наклона регрессии

куда:

  • n : общий размер выборки
  • y i : фактическое значение переменной ответа
  • ŷ i : прогнозируемое значение переменной ответа
  • x i : фактическое значение переменной-предиктора
  • : среднее значение переменной-предиктора

Чем меньше стандартная ошибка, тем ниже изменчивость оценки коэффициента наклона регрессии.

Стандартная ошибка наклона регрессии будет отображаться в столбце «стандартная ошибка» в выводе регрессии большинства статистических программ:

В следующих примерах показано, как интерпретировать стандартную ошибку наклона регрессии в двух разных сценариях.

Пример 1. Интерпретация малой стандартной ошибки наклона регрессии

Предположим, профессор хочет понять взаимосвязь между количеством часов обучения и итоговой оценкой на экзамене, полученной студентами в его классе.

Он собирает данные по 25 ученикам и создает следующую диаграмму рассеяния:

Существует четкая положительная связь между двумя переменными. По мере увеличения часов обучения экзаменационный балл увеличивается с довольно предсказуемой скоростью.

Затем он подбирает простую модель линейной регрессии, используя часы обучения в качестве переменной-предиктора и итоговый балл экзамена в качестве переменной-ответа.

В следующей таблице показаны результаты регрессии:

Коэффициент для предикторной переменной «изучаемые часы» равен 5,487. Это говорит нам о том, что каждый дополнительный час обучения связан со средним увеличением экзаменационного балла на 5,487 .

Стандартная ошибка составляет 0,419 , что является мерой изменчивости этой оценки наклона регрессии.

Мы можем использовать это значение для расчета t-статистики для предикторной переменной «изучаемые часы»:

  • t-статистика = оценка коэффициента / стандартная ошибка
  • t-статистика = 5,487 / 0,419
  • t-статистика = 13,112

Значение p, соответствующее этой тестовой статистике, равно 0,000, что указывает на то, что «отработанные часы» имеют статистически значимую связь с итоговой оценкой экзамена.

Поскольку стандартная ошибка наклона регрессии была небольшой по сравнению с оценкой коэффициента наклона регрессии, переменная-предиктор была статистически значимой.

Пример 2. Интерпретация большой стандартной ошибки наклона регрессии

Предположим, другой профессор хочет понять взаимосвязь между количеством часов обучения и итоговой оценкой на экзамене, полученной студентами в ее классе.

Она собирает данные по 25 ученикам и создает следующую диаграмму рассеяния:

По-видимому, существует небольшая положительная связь между двумя переменными. По мере увеличения часов обучения экзаменационная оценка обычно увеличивается, но не с предсказуемой скоростью.

Предположим, что затем профессор подбирает простую модель линейной регрессии, используя часы обучения в качестве переменной-предиктора и итоговый балл экзамена в качестве переменной-ответа.

В следующей таблице показаны результаты регрессии:

Коэффициент для предикторной переменной «изучаемые часы» равен 1,7919. Это говорит нам о том, что каждый дополнительный час обучения связан со средним увеличением экзаменационного балла на 1,7919 .

Стандартная ошибка составляет 1,0675 , что является мерой изменчивости этой оценки наклона регрессии.

Мы можем использовать это значение для расчета t-статистики для предикторной переменной «изучаемые часы»:

  • t-статистика = оценка коэффициента / стандартная ошибка
  • t-статистика = 1,7919/1,0675
  • t-статистика = 1,678

Значение p, соответствующее этой тестовой статистике, равно 0,107. Поскольку это p-значение не меньше 0,05, это указывает на то, что «учебные часы» не имеют статистически значимой связи с итоговой оценкой экзамена.

Поскольку стандартная ошибка наклона регрессии была большой по сравнению с оценкой коэффициента наклона регрессии, предикторная переменная не была статистически значимой.

Дополнительные ресурсы

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как читать и интерпретировать таблицу регрессии

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.