Как выполнить тест Вальда в R


Тест Вальда можно использовать для проверки того, равны ли один или несколько параметров в модели определенным значениям.

Этот тест часто используется для определения того, равны ли нулю одна или несколько переменных-предикторов в регрессионной модели .

Мы используем следующие нулевые и альтернативные гипотезы для этого теста:

  • H 0 : Некоторый набор переменных-предикторов равен нулю.
  • H A : Не все переменные-предикторы в наборе равны нулю.

Если нам не удастся отвергнуть нулевую гипотезу, то мы можем исключить указанный набор переменных-предикторов из модели, поскольку они не обеспечивают статистически значимого улучшения соответствия модели.

В следующем примере показано, как выполнить тест Вальда в R.

Пример: тест Вальда в R

В этом примере мы будем использовать встроенный набор данных mtcars в R, чтобы соответствовать следующей модели множественной линейной регрессии:

миль на галлон = β 0 + β 1 расход + β 2 карбюратор + β 3 л.с. + β 4 цилиндр

В следующем коде показано, как подогнать эту модель регрессии и просмотреть сводку модели:

#fit regression model
model <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + carb + hp + cyl, data = mtcars)

Residuals:
 Min 1Q Median 3Q Max 
-5.0761 -1.5752 -0.2051 1.0745 6.3047 

Coefficients:
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) 34.021595 2.523397 13.482 1.65e-13 \*\*\*
disp -0.026906 0.011309 -2.379 0.0247 \* 
carb -0.926863 0.578882 -1.601 0.1210 
hp 0.009349 0.020701 0.452 0.6551 
cyl -1.048523 0.783910 -1.338 0.1922 
---
Signif. codes: 0 '\*\*\*' 0.001 '\*\*' 0.01 '\*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.973 on 27 degrees of freedom
Multiple R-squared: 0.788, Adjusted R-squared: 0.7566 
F-statistic: 25.09 on 4 and 27 DF, p-value: 9.354e-09

Затем мы можем использовать функцию wald.test() из пакета aod , чтобы проверить, равны ли нулю коэффициенты регрессии для переменных-предикторов «hp» и «cyl».

Эта функция использует следующий базовый синтаксис:

wald.test(Сигма, б, Термины)

куда:

  • Sigma : матрица дисперсии-ковариации регрессионной модели.
  • b : вектор коэффициентов регрессии из модели.
  • Термины : вектор, указывающий, какие коэффициенты тестировать.

Следующий код показывает, как использовать эту функцию на практике:

library (aod)

#perform Wald Test to determine if 3rd and 4th predictor variables are both zero
wald. test (Sigma = vcov(model), b = coef(model), Terms = 3:4)

Wald test:
----------

Chi-squared test:
X2 = 3.6, df = 2, P(> X2) = 0.16

Из вывода мы видим, что p-значение теста равно 0,16.

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу теста Вальда.

Это означает, что мы можем предположить, что коэффициенты регрессии для переменных-предикторов «hp» и «cyl» равны нулю.

Мы можем исключить эти термины из модели, поскольку они статистически не улучшают общее соответствие модели.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как интерпретировать вывод регрессии в R
Как рассчитать коэффициент инфляции дисперсии (VIF) в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.