Понимание t-теста в линейной регрессии

Понимание t-теста в линейной регрессии

Линейная регрессия используется для количественной оценки взаимосвязи между переменной-предиктором и переменной-ответом.

Всякий раз, когда мы выполняем линейную регрессию, мы хотим знать, существует ли статистически значимая связь между переменной-предиктором и переменной-ответом.

Мы проверяем значимость, выполняя t-тест для наклона регрессии. Мы используем следующую нулевую и альтернативную гипотезу для этого t-критерия:

  • H 0 : β 1 = 0 (наклон равен нулю)
  • H A : β 1 ≠ 0 (наклон не равен нулю)

Затем мы вычисляем тестовую статистику следующим образом:

т = б / SE *б*

куда:

  • b : оценка коэффициента
  • SE b : стандартная ошибка оценки коэффициента

Если значение p, соответствующее t , меньше некоторого порога (например, α = 0,05), то мы отклоняем нулевую гипотезу и делаем вывод, что существует статистически значимая связь между переменной-предиктором и переменной-ответом.

В следующем примере показано, как выполнить t-критерий для модели линейной регрессии на практике.

Пример. Выполнение t-теста для линейной регрессии

Предположим, профессор хочет проанализировать взаимосвязь между часами обучения и экзаменационными баллами, полученными 40 его студентами.

Он выполняет простую линейную регрессию, используя количество часов обучения в качестве переменной-предиктора и полученную оценку за экзамен в качестве переменной-ответа.

В следующей таблице показаны результаты регрессионной модели:

Чтобы определить, имеют ли часы обучения статистически значимую связь с итоговой оценкой экзамена, мы можем выполнить t-критерий.

Мы используем следующую нулевую и альтернативную гипотезу для этого t-критерия:

  • H 0 : β 1 = 0 (наклон для исследуемых часов равен нулю)
  • H A : β 1 ≠ 0 (наклон для исследуемых часов не равен нулю)

Затем мы вычисляем тестовую статистику следующим образом:

  • т = б / SE б
  • т = 1,117/1,025
  • т = 1,089

Значение p, соответствующее t = 1,089 с df = n-2 = 40 – 2 = 38, равно 0,283 .

Обратите внимание, что мы также можем использовать калькулятор T Score to P Value Calculator для расчета этого p-значения:

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что количество учебных часов не имеет статистически значимой связи между итоговой оценкой на экзамене.

Дополнительные ресурсы

Следующие руководства предлагают дополнительную информацию о линейной регрессии:

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Как интерпретировать коэффициенты регрессии
Как интерпретировать F-тест общей значимости в регрессии

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.