Как выполнить двухсторонний ANOVA в SAS


Двухфакторный дисперсионный анализ используется для определения того, существует ли статистически значимое различие между средними значениями трех или более независимых групп, разделенных на две переменные (иногда называемые «факторами»).

В этом руководстве представлен пошаговый пример выполнения двухфакторного дисперсионного анализа в SAS.

Шаг 1: Создайте данные

Предположим, ботаник хочет знать, влияет ли на рост растений воздействие солнечного света и частота полива.

Она сажает 30 семян и позволяет им расти в течение одного месяца при различных условиях солнечного света и частоты полива. Через месяц она записывает высоту каждого растения. Результаты показаны ниже:

Мы можем использовать следующий код для создания этого набора данных в SAS:

/\*create dataset\*/
data my_data;
 input water $ sunlight $ height;
 datalines ;
daily low 6
daily low 6
daily low 6
daily low 5
daily low 6
daily med 5
daily med 5
daily med 6
daily med 4
daily med 5
daily high 6
daily high 6
daily high 7
daily high 8
daily high 7
weekly low 3
weekly low 4
weekly low 4
weekly low 4
weekly low 5
weekly med 4
weekly med 4
weekly med 4
weekly med 4
weekly med 4
weekly high 5
weekly high 6
weekly high 6
weekly high 7
weekly high 8
;
run ;

Шаг 2. Выполните двухфакторный дисперсионный анализ.

Далее мы будем использовать proc ANOVA для выполнения двустороннего ANOVA:

/\*perform two-way ANOVA\*/
proc ANOVA data =my_data;
class water sunlight;
model height = water sunlight water\*sunlight;
means water sunlight / tukey cldiff ;
run ;

Шаг 3: интерпретируйте результаты

Первая таблица, которую мы хотим проанализировать в результатах, — это таблица ANOVA:

Из этой таблицы мы видим:

  • P-значение для воды: 0,0005
  • Значение p для солнечного света: <0,0001
  • Значение p для взаимодействия между водой и солнечным светом:.1207

Это говорит нам о том, что и вода, и солнечный свет являются статистически значимыми предикторами высоты растений и что между водой и солнечным светом нет статистически значимого эффекта взаимодействия.

Затем мы можем посмотреть на результаты апостериорных тестов Тьюки, чтобы определить, какие уровни воды и солнечного света различаются статистически значимо.

Во-первых, мы рассмотрим апостериорные сравнения Тьюки для воды:

Из результатов мы видим, что средняя разница в высоте между растениями, которые поливались ежедневно и еженедельно, составила 1,0667 дюйма.

95% доверительный интервал для разницы в среднем росте составляет [0,5163, 1,6170].Это означает, что мы на 95% уверены, что истинная разница в средней высоте между растениями, поливаемыми ежедневно, и растениями, поливаемыми еженедельно, составляет от 0,5163 дюйма до 1,6170 дюйма.

Во-первых, мы рассмотрим апостериорные сравнения Тьюки для солнечного света:

Чтобы сказать, какие групповые средние отличаются, мы должны посмотреть, какие парные сравнения имеют звездочки ( *** ) рядом с ними.

Из таблицы видно, что статистически значимо различаются следующие групповые средние:

  • Яркий солнечный свет против слабого солнечного света (95% ДИ = [0,8844, 2,5156])
  • Яркий солнечный свет по сравнению со средним солнечным светом (95% ДИ = [1,2844, 2,9156])

Шаг 4: Сообщите о результатах

Наконец, мы можем сообщить о результатах двустороннего дисперсионного анализа:

Был проведен двухфакторный дисперсионный анализ для анализа влияния частоты полива и воздействия солнечного света на рост растений.
Двусторонний ANOVA показал, что не было статистически значимого взаимодействия между эффектами частоты полива и воздействия солнечного света (p = 0,1207).
Простой анализ основных эффектов показал, что частота полива оказывает статистически значимое влияние на рост растений (p = 0,0005).
Простой анализ основных эффектов показал, что воздействие солнечного света также оказывает статистически значимое влияние на рост растений (p < 0,0001).

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о двухфакторном ANOVA:

Введение в двухфакторный дисперсионный анализ
Однофакторный и двухфакторный дисперсионный анализ: когда использовать каждый из них
Как выполнить двухфакторный дисперсионный анализ вручную