Как рассчитать доверительный интервал для наклона регрессии

Как рассчитать доверительный интервал для наклона регрессии

Простая линейная регрессия используется для количественной оценки взаимосвязи между переменной-предиктором и переменной-ответом.

Этот метод находит строку, которая лучше всего «соответствует» набору данных, и принимает следующий вид:

ŷ = б 0 + б 1 х

куда:

  • ŷ : Расчетное значение отклика
  • b 0 : точка пересечения линии регрессии
  • b 1 : Наклон линии регрессии
  • x : значение переменной-предиктора

Часто нас интересует значение b 1 , которое сообщает нам среднее изменение переменной отклика , связанное с увеличением на одну единицу переменной предиктора.

Мы можем использовать следующую формулу для расчета доверительного интервала для значения β 1 , значения наклона для генеральной совокупности:

Доверительный интервал для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

куда:

  • b 1 = коэффициент наклона, показанный в таблице регрессии
  • t 1-∝/2, n-2 = критическое значение t для доверительного уровня 1-∝ с n-2 степенями свободы, где n — общее количество наблюдений в нашем наборе данных
  • se(b 1 ) = стандартная ошибка b 1 , показанная в таблице регрессии

В следующем примере показано, как на практике рассчитать доверительный интервал для наклона регрессии.

Пример: доверительный интервал для наклона регрессии

Предположим, мы хотим подогнать простую модель линейной регрессии, используя часы обучения в качестве переменной-предиктора и баллы за экзамены в качестве переменной-ответа для 15 учеников в конкретном классе:

Мы можем выполнить простую линейную регрессию в Excel и получить следующий результат:

Используя оценки коэффициентов в выходных данных, мы можем записать подобранную простую модель линейной регрессии как:

Оценка = 65,334 + 1,982 * (часы обучения)

Значение наклона регрессии равно 1,982 .

Это говорит нам о том, что каждый дополнительный час обучения связан со средним увеличением экзаменационного балла на 1,982 .

Мы можем использовать следующую формулу для расчета 95% доверительного интервала для перехвата:

  • 95% ДИ для β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% ДИ для β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% ДИ для β 1 : 1,982 ± 2,1604 * 0,248
  • 95% ДИ для β 1 : [1,446, 2,518]

95% доверительный интервал для наклона регрессии составляет [1,446, 2,518] .

Поскольку этот доверительный интервал не содержит значения 0, мы можем заключить, что существует статистически значимая связь между отработанными часами и экзаменационной оценкой.

Примечание.Мы использовали Калькулятор обратного распределения t , чтобы найти критическое значение t, соответствующее 95% доверительному уровню с 13 степенями свободы.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о линейной регрессии:

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как читать и интерпретировать таблицу регрессии
Как сообщить о результатах регрессии

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.