В статистике комплексный тест — это любой статистический тест, который проверяет значимость нескольких параметров в модели одновременно.
Например, предположим, что у нас есть следующие нулевая и альтернативная гипотезы:
H 0 : μ 1 = μ 2 = μ 3 = … = μ k (все средние значения населения равны)
H A : По крайней мере одно среднее значение генеральной совокупности отличается от остальных
Это пример комплексного теста, поскольку нулевая гипотеза содержит более двух параметров.
Если мы отклоняем нулевую гипотезу, мы знаем, что по крайней мере одно из средних значений совокупности отличается от остальных, но мы не знаем конкретно, какие средние значения совокупности отличаются.
Совокупный тест чаще всего используется в моделях ANOVA и моделях множественной линейной регрессии .
В этом руководстве представлен пример комплексного теста как в однофакторном дисперсионном анализе, так и в модели множественной линейной регрессии.
Совокупный тест в однофакторном дисперсионном анализе
Предположим, профессор хочет знать, приводят ли три разные программы подготовки к экзаменам к разным экзаменационным баллам. Чтобы проверить это, он случайным образом назначает 10 студентов для использования каждой программы подготовки к экзамену в течение одного месяца, а затем проводит один и тот же экзамен для студентов в каждой группе.
Ниже представлены результаты экзаменов для каждой группы:
Чтобы определить, приводит ли каждая программа подготовки к одинаковым экзаменационным баллам, он выполняет однофакторный дисперсионный анализ, используя следующие нулевую и альтернативную гипотезы:
ЧАС 0 : μ 1 = μ 2 = μ 3
H A : По крайней мере, одна программа подготовки к экзамену дает разные средние баллы по сравнению с остальными.
Это пример комплексного теста, поскольку нулевая гипотеза имеет более двух параметров.
Используя калькулятор однофакторного дисперсионного анализа , он может составить следующую таблицу дисперсионного анализа:
Чтобы определить, может ли он отвергнуть или не отвергнуть нулевую гипотезу, ему нужно только взглянуть на статистику F-теста и соответствующее значение p в таблице.
Статистика F-теста равна 2,358 , а соответствующее значение p равно 0,11385.Поскольку это p-значение не меньше 0,05, он не может отвергнуть нулевую гипотезу.
Другими словами, у него нет достаточных доказательств того, что какие-либо программы подготовки к экзаменам приводят к разным средним экзаменационным баллам.
Примечание. Если бы значение p было меньше 0,05, профессор отклонил бы нулевую гипотезу. Затем он мог проводить апостериорные тесты , чтобы точно определить, какие программы дают разные средние экзаменационные баллы.
Омнибусный тест в модели множественной линейной регрессии
Предположим, профессор хочет определить, могут ли количество часов обучения и количество сданных подготовительных экзаменов предсказать экзаменационную оценку, которую получит студент.
Чтобы проверить это, он собирает данные о 20 студентах и использует следующую модель множественной линейной регрессии:
Оценка за экзамен = β 0 + β 1 (часы) + β 2 (подготовительные экзамены)
В этой регрессионной модели используются следующие нулевая и альтернативная гипотезы:
Н 0 : β 1 = β 2 = 0
H A : По крайней мере один коэффициент не равен нулю.
Это пример комплексного теста, потому что нулевая гипотеза проверяет, равны ли нулю сразу несколько параметров.
Следующие выходные данные регрессии в Excel показывают результаты этой модели регрессии:
Чтобы определить, может ли он отвергнуть или не отвергнуть нулевую гипотезу, ему нужно только взглянуть на статистику F-теста и соответствующее значение p в таблице.
Статистика F-теста равна 23,46 , а соответствующее значение p равно 0,00.Поскольку это p-значение меньше 0,05, он может отвергнуть нулевую гипотезу и сделать вывод, что по крайней мере один из коэффициентов модели не равен нулю.
Однако простое отклонение нулевой гипотезы этого комплексного теста на самом деле не говорит ему, какие коэффициенты модели не равны нулю. Чтобы определить это, он должен посмотреть на p-значения для отдельных коэффициентов модели:
- P-значение часов: 0,00
- P-значение подготовительных экзаменов: 0,52
Это говорит ему о том, что часы являются статистически значимым предиктором экзаменационного балла, а подготовительные экзамены — нет.
Резюме
Вот краткое изложение того, что мы узнали из этой статьи:
- Совокупный тест используется для проверки значимости сразу нескольких параметров модели.
- Если мы отклоняем нулевую гипотезу комплексного теста, мы знаем, что по крайней мере один параметр модели является значимым.
- Если мы отклоняем нулевую гипотезу модели ANOVA, мы можем использовать апостериорные тесты , чтобы определить, какие средние значения совокупности действительно отличаются.
- Если мы отклоняем нулевую гипотезу модели множественной линейной регрессии, мы можем посмотреть на p-значения для отдельных коэффициентов модели, чтобы определить, какие из них являются статистически значимыми.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнить однофакторный дисперсионный анализ и множественную линейную регрессию в Excel.
Как выполнить однофакторный дисперсионный анализ в Excel
Как выполнить множественную линейную регрессию в Excel