Как интерпретировать коды значимости в R


Когда вы выполняете регрессионный анализ или ANOVA в R, выходные таблицы будут содержать p-значения для переменных, используемых в анализе, вместе с соответствующими кодами значимости .

Эти коды значимости отображаются в виде ряда звездочек или десятичной точки, если переменные статистически значимы.

Вот как интерпретировать различные коды значимости:

significance code p-value
 \*\*\* [0, 0.001]
 \*\* (0.001, 0.01]
 \* (0.01, 0.05]
.(0.05, 0.1]
 (0.1, 1] 

Следующие примеры показывают, как интерпретировать эти коды значимости на практике.

Пример: коды значимости в регрессии

В следующем коде показано, как подобрать модель множественной линейной регрессии со встроенным набором данных mtcars , используя hp , drat и wt в качестве переменных-предикторов и mpg в качестве переменной ответа:

#fit regression model using hp, drat, and wt as predictors
model <- lm(mpg ~ hp + drat + wt, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Residuals:
 Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078 

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 29.394934 6.156303 4.775 5.13e-05 \*\*\*
hp -0.032230 0.008925 -3.611 0.001178 \*\* 
drat 1.615049 1.226983 1.316 0.198755 
wt -3.227954 0.796398 -4.053 0.000364 \*\*\*
---
Signif. codes: 0 ‘\*\*\*’ 0.001 ‘\*\*’ 0.01 ‘\*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

Вот как интерпретировать коды значимости для трех переменных-предикторов:

  • hp имеет p-значение 0,001178.Поскольку это значение находится в диапазоне (0,001, 0,01] , оно имеет код значимости **
  • drat имеет p-значение .198755.Поскольку это значение находится в диапазоне (0,1, 1] , оно не имеет кода значимости.
  • wt имеет p-значение 0,000364.Поскольку это значение находится в диапазоне [0, 0,001] , оно имеет код значимости ***

Если бы мы использовали альфа-уровень α = 0,05, чтобы определить, какие предикторы были значимы в этой регрессионной модели, мы бы сказали, что hp и wt являются статистически значимыми предикторами, а drat — нет.

Пример: Коды значимости в ANOVA

В следующем коде показано, как подобрать однофакторную модель ANOVA со встроенным набором данных mtcars, используя gear в качестве факторной переменной и mpg в качестве переменной отклика:

#fit one-way ANOVA
model <- aov(mpg ~ gear, data = mtcars)

#view the model output
summary(model)

 Df Sum Sq Mean Sq F value Pr(>F) 
gear 1 259.7 259.75 8.995 0.0054 \*\*
Residuals 30 866.3 28.88 
---
Signif. codes: 0 ‘\*\*\*’ 0.001 ‘\*\*’ 0.01 ‘\*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Вот как интерпретировать код значимости в выводе:

  • Шестерня имеет p-значение 0,0054.Поскольку это значение находится в диапазоне (0,001, 0,01] , оно имеет код значимости **

Используя альфа-уровень α = 0,05, мы бы сказали, что снаряжение является статистически значимым. Другими словами, существует статистически значимая разница между средним расходом автомобилей на галлон в зависимости от их значения для передачи .