Что такое Y Hat в статистике?

Что такое Y Hat в статистике?

В статистике термин y hat (записывается как ŷ ) относится к оценочному значению переменной отклика в модели линейной регрессии .

Обычно мы пишем оценочное уравнение регрессии следующим образом:

ŷ = β 0 + β 1 х

куда:

  • ŷ : расчетное значение переменной ответа
  • β 0 : среднее значение переменной отклика, когда переменная-предиктор равна нулю.
  • β 1 : среднее изменение переменной отклика, связанное с увеличением на одну единицу переменной предиктора.

Например, предположим, что у нас есть следующий набор данных, который показывает количество часов, отработанных шестью разными студентами, а также их итоговые оценки за экзамены:

Предположим, мы используем какое-то статистическое программное обеспечение (такое как R , Excel , Python или даже вручную ), чтобы подобрать следующую модель регрессии, используя количество часов обучения в качестве переменной-предиктора и баллы на экзамене в качестве переменной-ответа:

Оценка = 66,615 + 5,0769 * (часы)

Способ интерпретации коэффициентов регрессии в этой модели следующий:

  • Средний балл на экзамене для студента, изучающего ноль часов, составляет 66,615 .
  • Экзаменационный балл увеличивается в среднем на 5,0769 балла за каждый дополнительный час обучения.

Мы можем использовать это уравнение регрессии, чтобы оценить балл данного учащегося на основе количества часов, которые он проучился.

Например, предполагается, что студент, который занимается 3 часа, получит:

Оценка = 66,615 + 5,0769 * (3) = 81,85

Почему используется Y Hat?

Символ «шляпа» в статистике используется для обозначения любого «оценочного» термина. Например, ŷ используется для обозначения оценочной переменной отклика.

Обычно, когда мы подбираем модели линейной регрессии, мы используем выборку данных из совокупности, поскольку это более удобно и требует меньше времени, чем сбор данных для каждого возможного наблюдения в совокупности.

Итак, когда мы находим уравнение регрессии, мы только оцениваем истинную связь между переменной-предиктором и переменной-ответом.

Вот почему мы используем термин ŷ в уравнении регрессии вместо y.

Дополнительные ресурсы

Введение в простую линейную регрессию
Введение в множественную линейную регрессию
Введение в объясняющие переменные и переменные отклика

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.