R-квадрат , часто обозначаемый как r 2 , является мерой того, насколько хорошо модель линейной регрессии соответствует набору данных.
С технической точки зрения, это доля дисперсии переменной отклика, которая может быть объяснена предикторной переменной.
Значение для r 2 может варьироваться от 0 до 1:
- Значение 0 указывает, что переменная отклика вообще не может быть объяснена предикторной переменной.
- Значение 1 указывает, что переменная отклика может быть полностью объяснена без ошибок с помощью переменной-предиктора.
Связанный: Что такое хорошее значение R-квадрата?
В этом руководстве объясняется, как рассчитать r 2 для двух переменных в Excel.
Пример: расчет R-квадрата в Excel
Предположим, у нас есть следующие данные о количестве часов обучения и экзаменационном балле, полученном для 20 студентов:

Теперь предположим, что мы заинтересованы в подгонке к этим данным простой модели линейной регрессии, используя «часы» в качестве переменной-предиктора и «оценку» в качестве переменной-ответа.
Чтобы найти r 2 для этих данных, мы можем использовать функцию RSQ() в Excel, которая использует следующий синтаксис:
=RSQ(известный_ys, известный_xs)
куда:
- known_ys: значения для переменной ответа
- known_xs: значения для переменной-предиктора
Вот как эта формула выглядит в нашем примере:

В этом примере 72,73 % различий в баллах за экзамены можно объяснить количеством часов обучения.
Обратите внимание, что если мы подгоним к этим данным простую модель линейной регрессии , результат будет выглядеть следующим образом:

Обратите внимание, что значение R Square в первой таблице равно 0,7273 , что соответствует результату, полученному с помощью функции RSQ().