Как интерпретировать Pr(>|t|) в выходных данных регрессионной модели в R

Всякий раз, когда вы выполняете линейную регрессию в R, выходные данные вашей регрессионной модели будут отображаться в следующем формате:

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 10.0035 5.9091 1.693 0.1513 
x1 1.4758 0.5029 2.935 0.0325 \*
x2 -0.7834 0.8014 -0.978 0.3732

Столбец Pr(>|t|) представляет значение p, связанное со значением в столбце значения t .

Если p-значение меньше определенного уровня значимости (например, α = 0,05), то говорят, что переменная-предиктор имеет статистически значимую связь с переменной отклика в модели.

В следующем примере показано, как интерпретировать значения в столбце Pr(>|t|) для данной модели регрессии.

Пример. Как интерпретировать значения Pr(>|t|)

Предположим, мы хотели бы подобрать модель множественной линейной регрессии, используя переменные-предикторы x1 и x2 и одну переменную ответа y .

В следующем коде показано, как создать фрейм данных и подогнать модель регрессии к данным:

#create data frame
df <- data.frame(x1=c(1, 3, 3, 4, 4, 5, 6, 6),
 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
 1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 10.0035 5.9091 1.693 0.1513 
x1 1.4758 0.5029 2.935 0.0325 \*
x2 -0.7834 0.8014 -0.978 0.3732 
---
Signif. codes: 0 ‘\*\*\*’ 0.001 ‘\*\*’ 0.01 ‘\*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Вот как интерпретировать значения в столбце Pr(>|t|):

Значение p для переменной-предиктора x1 равно 0,0325.Поскольку это значение меньше 0,05, оно имеет статистически значимую связь с переменной отклика в модели.
Значение p для переменной-предиктора x2 равно 0,3732.Поскольку это значение не меньше 0,05, оно не имеет статистически значимой связи с переменной отклика в модели.

Коды значимости под таблицей коэффициентов говорят нам, что одна звездочка (*) рядом со значением p, равным 0,0325, означает, что значение p является статистически значимым при α = 0,05.

Как на самом деле рассчитывается Pr(>|t|)?

Вот как вычисляется значение Pr(>|t|):

Шаг 1: Рассчитайте значение t

Сначала мы вычисляем значение t по следующей формуле:

значение t = оценка / стандарт. Ошибка

Например, вот как вычислить значение t для предикторной переменной x1:

#calculate t-value
1.4758 / .5029

[1] 2.934579

Шаг 2: Рассчитайте p-значение

Далее мы вычисляем p-значение. Это представляет вероятность того, что абсолютное значение t-распределения больше 2,935.

Мы можем использовать следующую формулу в R для вычисления этого значения:

p-значение = 2 * pt (абс (значение t), остаточная df, нижний.хвост = ЛОЖЬ)

Например, вот как рассчитать p-значение для t-значения 2,935 с 5 остаточными степенями свободы:

#calculate p-value
2 \* pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Обратите внимание, что это p-значение соответствует p-значению в выходных данных регрессии сверху.

Примечание.Значение остаточных степеней свободы можно найти в нижней части выходных данных регрессии. В нашем примере их оказалось 5:

Residual standard error: 1.867 on 5 degrees of freedom

Дополнительные ресурсы

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как построить результаты множественной линейной регрессии в R

Как интерпретировать Pr(&gt;|t|) в выходных данных регрессионной модели в R

Пример. Как интерпретировать значения Pr(>|t|)

Как на самом деле рассчитывается Pr(>|t|)?

Дополнительные ресурсы

Редакция Кодкампа

Как интерпретировать Pr(>|t|) в выходных данных регрессионной модели в R