Как выполнить односторонний ANOVA в SAS


Однофакторный дисперсионный анализ используется для определения того, существует ли статистически значимое различие между средними значениями трех или более независимых групп.

В этом руководстве представлен пошаговый пример выполнения однофакторного дисперсионного анализа в SAS.

Шаг 1: Создайте данные

Предположим, исследователь набирает 30 студентов для участия в исследовании. Студентам случайным образом назначают использовать один из трех методов обучения для подготовки к экзамену.

Результаты экзамена для каждого студента показаны ниже:

Мы можем использовать следующий код для создания этого набора данных в SAS:

/\*create dataset\*/
data my_data;
 input Method $ Score;
 datalines ;
A 78
A 81
A 82
A 82
A 85
A 88
A 88
A 90
B 81
B 83
B 83
B 85
B 86
B 88
B 90
B 91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;

Шаг 2. Выполните однофакторный дисперсионный анализ.

Далее мы будем использовать proc ANOVA для выполнения однофакторного ANOVA:

/\*perform one-way ANOVA\*/
proc ANOVA data =my_data;
class Method;
model Score = Method;
means Method / tukey cldiff ;
run ;

Примечание.Мы использовали функцию среднего значения, чтобы указать, что апостериорный тест Тьюки должен выполняться, если общее значение p однофакторного дисперсионного анализа является статистически значимым.

Шаг 3: интерпретируйте результаты

Первая таблица, которую мы хотим проанализировать в результатах, — это таблица ANOVA:

Из этой таблицы мы видим:

  • Общее значение F: 5,26
  • Соответствующее значение p: 0,0140

Напомним, что однофакторный дисперсионный анализ использует следующие нулевую и альтернативную гипотезы:

  • H 0 : Все средние группы равны.
  • H A : по крайней мере одно среднее значение группы отличаетсяот остальных.

Поскольку значение p из таблицы ANOVA (0,0140) меньше, чем α = 0,05, мы отклоняем нулевую гипотезу.

Это говорит нам о том, что средний балл за экзамен не одинаков между тремя методами обучения.

Связанный: Как интерпретировать F-значение и P-значение в ANOVA

SAS также предоставляет диаграммы для визуализации распределения экзаменационных баллов по каждому из трех методов обучения:

Из диаграмм мы видим, что экзаменационные баллы, как правило, выше у студентов, которые использовали метод обучения C, по сравнению с методами B и C.

Чтобы точно определить, какие групповые средние отличаются, мы должны обратиться к итоговой таблице в выходных данных, которая показывает результаты апостериорных тестов Тьюки:

Чтобы сказать, какие групповые средние отличаются, мы должны посмотреть, какие парные сравнения имеют звездочки ( *** ) рядом с ними.

Из таблицы видно, что средние значения для групп А и С статистически значимо различаются.

Мы также можем увидеть 95% доверительный интервал для разницы в средних баллах по экзаменам между группами A и C:

95% доверительный интервал для разницы в средних: [1,228, 11,522]

Шаг 4: Сообщите о результатах

Наконец, мы можем сообщить о результатах однофакторного дисперсионного анализа:

Был проведен однофакторный дисперсионный анализ для сравнения влияния трех разных методов обучения на результаты экзаменов.
Однофакторный дисперсионный анализ показал, что существует статистически значимая разница в среднем экзаменационном балле как минимум между двумя группами (F(2, 21) = [5,26], p = 0,014).
Тест Тьюки HSD для множественных сравнений показал, что среднее значение экзаменационного балла значительно различалось между методом C и методом A (95% ДИ = [1,228, 11,522]).
Статистически значимой разницы в средних баллах по экзаменам между методом А и методом Б или между методом В и методом С не было.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию об однофакторных дисперсионных анализах:

Введение в однофакторный дисперсионный анализ
Калькулятор однофакторного дисперсионного анализа
Как выполнить однофакторный дисперсионный анализ вручную