Как интерпретировать Pr(>|t|) в выходных данных регрессионной модели в R


Всякий раз, когда вы выполняете линейную регрессию в R, выходные данные вашей регрессионной модели будут отображаться в следующем формате:

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 10.0035 5.9091 1.693 0.1513 
x1 1.4758 0.5029 2.935 0.0325 \*
x2 -0.7834 0.8014 -0.978 0.3732

Столбец Pr(>|t|) представляет значение p, связанное со значением в столбце значения t .

Если p-значение меньше определенного уровня значимости (например, α = 0,05), то говорят, что переменная-предиктор имеет статистически значимую связь с переменной отклика в модели.

В следующем примере показано, как интерпретировать значения в столбце Pr(>|t|) для данной модели регрессии.

Пример. Как интерпретировать значения Pr(>|t|)

Предположим, мы хотели бы подобрать модель множественной линейной регрессии, используя переменные-предикторы x1 и x2 и одну переменную ответа y .

В следующем коде показано, как создать фрейм данных и подогнать модель регрессии к данным:

#create data frame
df <- data.frame(x1=c(1, 3, 3, 4, 4, 5, 6, 6),
 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
 1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 10.0035 5.9091 1.693 0.1513 
x1 1.4758 0.5029 2.935 0.0325 \*
x2 -0.7834 0.8014 -0.978 0.3732 
---
Signif. codes: 0 ‘\*\*\*’ 0.001 ‘\*\*’ 0.01 ‘\*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Вот как интерпретировать значения в столбце Pr(>|t|):

  • Значение p для переменной-предиктора x1 равно 0,0325.Поскольку это значение меньше 0,05, оно имеет статистически значимую связь с переменной отклика в модели.
  • Значение p для переменной-предиктора x2 равно 0,3732.Поскольку это значение не меньше 0,05, оно не имеет статистически значимой связи с переменной отклика в модели.

Коды значимости под таблицей коэффициентов говорят нам, что одна звездочка (*) рядом со значением p, равным 0,0325, означает, что значение p является статистически значимым при α = 0,05.

Как на самом деле рассчитывается Pr(>|t|)?

Вот как вычисляется значение Pr(>|t|):

Шаг 1: Рассчитайте значение t

Сначала мы вычисляем значение t по следующей формуле:

  • значение t = оценка / стандарт. Ошибка

Например, вот как вычислить значение t для предикторной переменной x1:

#calculate t-value
1.4758 / .5029

[1] 2.934579

Шаг 2: Рассчитайте p-значение

Далее мы вычисляем p-значение. Это представляет вероятность того, что абсолютное значение t-распределения больше 2,935.

Мы можем использовать следующую формулу в R для вычисления этого значения:

  • p-значение = 2 * pt (абс (значение t), остаточная df, нижний.хвост = ЛОЖЬ)

Например, вот как рассчитать p-значение для t-значения 2,935 с 5 остаточными степенями свободы:

#calculate p-value
2 \* pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Обратите внимание, что это p-значение соответствует p-значению в выходных данных регрессии сверху.

Примечание.Значение остаточных степеней свободы можно найти в нижней части выходных данных регрессии. В нашем примере их оказалось 5:

Residual standard error: 1.867 on 5 degrees of freedom

Дополнительные ресурсы

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как построить результаты множественной линейной регрессии в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.