Однофакторный дисперсионный анализ используется для определения того, существует ли статистически значимое различие между средними значениями трех или более независимых групп.
В этом руководстве представлен пошаговый пример выполнения однофакторного дисперсионного анализа в SAS.
Шаг 1: Создайте данные
Предположим, исследователь набирает 30 студентов для участия в исследовании. Студентам случайным образом назначают использовать один из трех методов обучения для подготовки к экзамену.
Результаты экзамена для каждого студента показаны ниже:
Мы можем использовать следующий код для создания этого набора данных в SAS:
/\*create dataset\*/
data my_data;
input Method $ Score;
datalines ;
A 78
A 81
A 82
A 82
A 85
A 88
A 88
A 90
B 81
B 83
B 83
B 85
B 86
B 88
B 90
B 91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;
Шаг 2. Выполните однофакторный дисперсионный анализ.
Далее мы будем использовать proc ANOVA для выполнения однофакторного ANOVA:
/\*perform one-way ANOVA\*/
proc ANOVA data =my_data;
class Method;
model Score = Method;
means Method / tukey cldiff ;
run ;
Примечание.Мы использовали функцию среднего значения, чтобы указать, что апостериорный тест Тьюки должен выполняться, если общее значение p однофакторного дисперсионного анализа является статистически значимым.
Шаг 3: интерпретируйте результаты
Первая таблица, которую мы хотим проанализировать в результатах, — это таблица ANOVA:
Из этой таблицы мы видим:
- Общее значение F: 5,26
- Соответствующее значение p: 0,0140
Напомним, что однофакторный дисперсионный анализ использует следующие нулевую и альтернативную гипотезы:
- H 0 : Все средние группы равны.
- H A : по крайней мере одно среднее значение группы отличаетсяот остальных.
Поскольку значение p из таблицы ANOVA (0,0140) меньше, чем α = 0,05, мы отклоняем нулевую гипотезу.
Это говорит нам о том, что средний балл за экзамен не одинаков между тремя методами обучения.
Связанный: Как интерпретировать F-значение и P-значение в ANOVA
SAS также предоставляет диаграммы для визуализации распределения экзаменационных баллов по каждому из трех методов обучения:
Из диаграмм мы видим, что экзаменационные баллы, как правило, выше у студентов, которые использовали метод обучения C, по сравнению с методами B и C.
Чтобы точно определить, какие групповые средние отличаются, мы должны обратиться к итоговой таблице в выходных данных, которая показывает результаты апостериорных тестов Тьюки:
Чтобы сказать, какие групповые средние отличаются, мы должны посмотреть, какие парные сравнения имеют звездочки ( *** ) рядом с ними.
Из таблицы видно, что средние значения для групп А и С статистически значимо различаются.
Мы также можем увидеть 95% доверительный интервал для разницы в средних баллах по экзаменам между группами A и C:
95% доверительный интервал для разницы в средних: [1,228, 11,522]
Шаг 4: Сообщите о результатах
Наконец, мы можем сообщить о результатах однофакторного дисперсионного анализа:
Был проведен однофакторный дисперсионный анализ для сравнения влияния трех разных методов обучения на результаты экзаменов.
Однофакторный дисперсионный анализ показал, что существует статистически значимая разница в среднем экзаменационном балле как минимум между двумя группами (F(2, 21) = [5,26], p = 0,014).
Тест Тьюки HSD для множественных сравнений показал, что среднее значение экзаменационного балла значительно различалось между методом C и методом A (95% ДИ = [1,228, 11,522]).
Статистически значимой разницы в средних баллах по экзаменам между методом А и методом Б или между методом В и методом С не было.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию об однофакторных дисперсионных анализах:
Введение в однофакторный дисперсионный анализ
Калькулятор однофакторного дисперсионного анализа
Как выполнить однофакторный дисперсионный анализ вручную