Как рассчитать R-квадрат в Excel (с примерами)


R-квадрат , часто обозначаемый как r 2 , является мерой того, насколько хорошо модель линейной регрессии соответствует набору данных.

С технической точки зрения, это доля дисперсии переменной отклика, которая может быть объяснена предикторной переменной.

Значение для r 2 может варьироваться от 0 до 1:

  • Значение 0 указывает, что переменная отклика вообще не может быть объяснена предикторной переменной.
  • Значение 1 указывает, что переменная отклика может быть полностью объяснена без ошибок с помощью переменной-предиктора.

Связанный: Что такое хорошее значение R-квадрата?

В этом руководстве объясняется, как рассчитать r 2 для двух переменных в Excel.

Пример: расчет R-квадрата в Excel

Предположим, у нас есть следующие данные о количестве часов обучения и экзаменационном балле, полученном для 20 студентов:

Теперь предположим, что мы заинтересованы в подгонке к этим данным простой модели линейной регрессии, используя «часы» в качестве переменной-предиктора и «оценку» в качестве переменной-ответа.

Чтобы найти r 2 для этих данных, мы можем использовать функцию RSQ() в Excel, которая использует следующий синтаксис:

=RSQ(известный_ys, известный_xs)

куда:

  • known_ys: значения для переменной ответа
  • known_xs: значения для переменной-предиктора

Вот как эта формула выглядит в нашем примере:

В этом примере 72,73 % различий в баллах за экзамены можно объяснить количеством часов обучения.

Обратите внимание, что если мы подгоним к этим данным простую модель линейной регрессии , результат будет выглядеть следующим образом:

Обратите внимание, что значение R Square в первой таблице равно 0,7273 , что соответствует результату, полученному с помощью функции RSQ().