Как рассчитать скорректированный R-квадрат в Excel


R -квадрат , часто обозначаемый как R2, представляет собой долю дисперсии переменной отклика , которая может быть объяснена переменными-предикторами в модели линейной регрессии .

Значение для R-квадрата может варьироваться от 0 до 1. Значение 0 указывает, что переменная отклика вообще не может быть объяснена предикторной переменной, в то время как значение 1 указывает, что переменная отклика может быть полностью объяснена предиктором без ошибок. переменные.

Скорректированный R-квадрат — это модифицированная версия R-квадрата, которая корректирует количество предикторов в регрессионной модели. Он рассчитывается как:

Скорректированный R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

куда:

  • R 2 : R 2 модели
  • n : количество наблюдений
  • k : Количество переменных-предикторов

Поскольку R 2 всегда увеличивается по мере того, как вы добавляете в модель больше предикторов, скорректированный R 2 может служить метрикой, которая говорит вам, насколько полезна модель, с поправкой на количество предикторов в модели .

В этом руководстве представлен пошаговый пример расчета скорректированного R 2 для регрессионной модели в R.

Шаг 1: Создайте данные

В этом примере мы создадим набор данных, содержащий следующие переменные для 12 разных учащихся:

  • Оценка экзамена
  • Часы, потраченные на учебу
  • Текущая оценка

Шаг 2: Подгонка регрессионной модели

Далее мы подгоним модель множественной линейной регрессии , используя экзаменационный балл в качестве переменной ответа и часы обучения и текущую оценку в качестве переменных-предикторов.

Чтобы соответствовать этой модели, щелкните вкладку « Данные » на верхней ленте, а затем щелкните « Анализ данных» :

Если вы не видите эту опцию доступной, вам нужно сначала загрузить Data Analysis ToolPak .

В появившемся окне выберите Регрессия.В появившемся новом окне заполните следующую информацию:

Как только вы нажмете OK , появится результат регрессионной модели:

Шаг 3: Интерпретация скорректированного R-квадрата

Скорректированный R-квадрат регрессионной модели представляет собой число рядом с Adjusted R Square :

Скорректированный R-квадрат для этой модели оказывается равным 0,946019 .

Это значение чрезвычайно велико, что указывает на то, что переменные-предикторы « Часы обучения» и « Текущая оценка » хорошо предсказывают результат экзамена .

Дополнительные ресурсы

Что такое хорошее значение R-квадрата?
Как рассчитать скорректированный R-квадрат в R
Как рассчитать скорректированный R-квадрат в Python