Тест Вальда можно использовать для проверки того, равны ли один или несколько параметров в модели определенным значениям.
Этот тест часто используется для определения того, равны ли нулю одна или несколько переменных-предикторов в регрессионной модели .
Мы используем следующие нулевые и альтернативные гипотезы для этого теста:
- H 0 : Некоторый набор переменных-предикторов равен нулю.
- H A : Не все переменные-предикторы в наборе равны нулю.
Если нам не удастся отвергнуть нулевую гипотезу, то мы можем исключить указанный набор переменных-предикторов из модели, поскольку они не обеспечивают статистически значимого улучшения соответствия модели.
В следующем примере показано, как выполнить тест Вальда в R.
Пример: тест Вальда в R
В этом примере мы будем использовать встроенный набор данных mtcars в R, чтобы соответствовать следующей модели множественной линейной регрессии:
миль на галлон = β 0 + β 1 расход + β 2 карбюратор + β 3 л.с. + β 4 цилиндр
В следующем коде показано, как подогнать эту модель регрессии и просмотреть сводку модели:
#fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)
#view model summary
summary(model)
Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.0761 -1.5752 -0.2051 1.0745 6.3047
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 34.021595 2.523397 13.482 1.65e-13 \*\*\*
disp -0.026906 0.011309 -2.379 0.0247 \*
carb -0.926863 0.578882 -1.601 0.1210
hp 0.009349 0.020701 0.452 0.6551
cyl -1.048523 0.783910 -1.338 0.1922
---
Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09
Затем мы можем использовать функцию wald.test() из пакета aod , чтобы проверить, равны ли нулю коэффициенты регрессии для переменных-предикторов «hp» и «cyl».
Эта функция использует следующий базовый синтаксис:
wald.test(Сигма, б, Термины)
куда:
- Sigma : матрица дисперсии-ковариации регрессионной модели.
- b : вектор коэффициентов регрессии из модели.
- Термины : вектор, указывающий, какие коэффициенты тестировать.
Следующий код показывает, как использовать эту функцию на практике:
library (aod)
#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)
Wald test:
----------
Chi-squared test:
X2 = 3.6, df = 2, P(> X2) = 0.16
Из вывода мы видим, что p-значение теста равно 0,16.
Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу теста Вальда.
Это означает, что мы можем предположить, что коэффициенты регрессии для переменных-предикторов «hp» и «cyl» равны нулю.
Мы можем исключить эти термины из модели, поскольку они статистически не улучшают общее соответствие модели.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в R:
Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как интерпретировать вывод регрессии в R
Как рассчитать коэффициент инфляции дисперсии (VIF) в R