Полное руководство: как сообщать о результатах регрессии


В статистике модели линейной регрессии используются для количественной оценки взаимосвязи между одной или несколькими переменными-предикторами и переменной отклика .

Мы можем использовать следующий общий формат для отчета о результатах простой модели линейной регрессии :

Простая линейная регрессия использовалась для проверки того, достоверно ли предсказала [переменная-предиктор] [переменная-ответ].
Подобранная регрессионная модель была: [подобранное уравнение регрессии]
Общая регрессия была статистически значимой (R 2 = [значение R 2 ], F (регрессия df, остаток df) = [значение F], p = [значение p]).
Было обнаружено, что [переменная-предиктор] достоверно предсказала [переменную ответа] (β = [β-значение], p = [p-значение]).

И мы можем использовать следующий формат для отчета о результатах модели множественной линейной регрессии :

Множественная линейная регрессия использовалась для проверки того, действительно ли [переменная-предиктор 1], [переменная-предиктор 2]… значительно предсказала [переменную ответа].
Подобранная регрессионная модель была: [подобранное уравнение регрессии]
Общая регрессия была статистически значимой (R 2 = [значение R 2 ], F (регрессия df, остаток df) = [значение F], p = [значение p]).
Было обнаружено, что [предикторная переменная 1] значительно предсказала [переменную ответа] (β = [β-значение], p = [p-значение]).
Было обнаружено, что [предикторная переменная 2] значимо не предсказывала [переменная ответа] (β = [β-значение], p = [p-значение]).

В следующих примерах показано, как сообщать результаты регрессии как для простой модели линейной регрессии, так и для модели множественной линейной регрессии.

Пример: отчет о результатах простой линейной регрессии

Предположим, профессор хотел бы использовать количество часов обучения, чтобы предсказать экзаменационный балл, который студенты получат на определенном экзамене. Он собирает данные для 20 студентов и использует простую модель линейной регрессии.

На следующем снимке экрана показаны выходные данные регрессионной модели:

Вот как сообщить о результатах модели:

Простая линейная регрессия использовалась для проверки того, насколько количество часов обучения значительно предсказывало результат на экзамене.
Подобранная регрессионная модель была следующей: Экзаменационный балл = 67,1617 + 5,2503*(изучаемые часы).
Общая регрессия была статистически значимой (R 2 = 0,73, F (1, 18) = 47,99, p < 0,000).
Было обнаружено, что количество часов обучения значительно предсказывает оценку экзамена (β = 5,2503, p < 0,000).

Пример: отчет о результатах множественной линейной регрессии

Предположим, профессор хотел бы использовать количество часов обучения и количество сданных подготовительных экзаменов, чтобы предсказать экзаменационный балл, который студенты получат на определенном экзамене. Он собирает данные по 20 учащимся и использует модель множественной линейной регрессии.

На следующем снимке экрана показаны выходные данные регрессионной модели:

Вот как сообщить о результатах модели:

Множественная линейная регрессия использовалась для проверки того, насколько количество часов обучения и сданные подготовительные экзамены предсказывают результаты экзамена.
Подобранная регрессионная модель была следующей: Экзаменационный балл = 67,67 + 5,56*(часы обучения) – 0,60*(пройденные подготовительные экзамены)
Общая регрессия была статистически значимой (R 2 = 0,73, F(2, 17) = 23,46, p = <0,000).
Было обнаружено, что количество часов обучения значительно предсказывало результат экзамена (β = 5,56, p = <0,000).
Было обнаружено, что сданные подготовительные экзамены не в значительной степени предсказывали экзаменационную оценку (β = -0,60, p = 0,52).

Дополнительные ресурсы

Как читать и интерпретировать таблицу регрессии
Понимание нулевой гипотезы для линейной регрессии
Понимание F-теста общей значимости в регрессии