Как выполнить частичный F-тест в Excel

Частичный F-тест используется для определения того, существует ли статистически значимое различие между регрессионной моделью и некоторой вложенной версией той же модели.

Вложенная модель — это просто модель, которая содержит подмножество переменных-предикторов в общей регрессионной модели.

Например, предположим, что у нас есть следующая регрессионная модель с четырьмя переменными-предикторами:

Y = β 0 + β 1 х 1 + β 2 х 2 + β 3 х 3 + β 4 х 4 + ε

Одним из примеров вложенной модели может быть следующая модель только с двумя исходными предикторными переменными:

Y = β 0 + β 1 х 1 + β 2 х 2 + ε

Чтобы определить, существенно ли различаются эти две модели, мы можем выполнить частичный F-тест, который вычисляет следующую статистику F-теста:

F = (( сокращенный RSS – полный RSS)/p) / ( полный RSS/nk)

куда:

Сокращенный RSS : Остаточная сумма квадратов сокращенной (т.е. «вложенной») модели.
RSS full : остаточная сумма квадратов полной модели.
p: количество предикторов, удаленных из полной модели.
n: общее количество наблюдений в наборе данных.
k: количество коэффициентов (включая точку пересечения) в полной модели.

В этом тесте используются следующие нулевая и альтернативная гипотезы :

H 0 : Все коэффициенты, удаленные из полной модели, равны нулю.

H A : По крайней мере один из коэффициентов, удаленных из полной модели, отличен от нуля.

Если значение p, соответствующее статистике F-теста, ниже определенного уровня значимости (например, 0,05), то мы можем отклонить нулевую гипотезу и сделать вывод, что по крайней мере один из коэффициентов, удаленных из полной модели, является значимым.

В следующем примере показано, как выполнить частичный F-тест в Excel.

Пример: Частичный F-тест в Excel

Предположим, у нас есть следующий набор данных в Excel:

Предположим, мы хотели бы определить, есть ли разница между следующими двумя регрессионными моделями:

Полная модель: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4

Уменьшенная модель: y = β 0 + β 1 x 1 + β 2 x 2

Мы можем приступить к выполнению множественной линейной регрессии в Excel для каждой модели, чтобы получить следующий результат:

Затем мы можем использовать следующую формулу для расчета статистики F-теста для частичного F-теста:

Тестовая статистика оказывается 2,064 .

Затем мы можем использовать следующую формулу для вычисления соответствующего p-значения:

Значение p оказывается равным 0,1974 .

Поскольку это p-значение не меньше 0,05, мы не сможем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы сказать, что любая из переменных-предикторов x3 или x4 является статистически значимой.

Другими словами, добавление x3 и x4 к регрессионной модели существенно не улучшает соответствие модели.

Дополнительные ресурсы

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как рассчитать стандартную ошибку регрессии в Excel

Как выполнить частичный F-тест в Excel

Пример: Частичный F-тест в Excel

Дополнительные ресурсы

Редакция Кодкампа