Как выполнить двухфакторный дисперсионный анализ вручную

Как выполнить двухфакторный дисперсионный анализ вручную

Двухфакторный дисперсионный анализ используется для определения того, существует ли статистически значимая разница между средними значениями трех или более независимых групп, разделенных на два фактора.

В этом учебном пособии объясняется, как выполнить двухфакторный дисперсионный анализ вручную.

Пример. Двухфакторный дисперсионный анализ вручную

Предположим, ботаник хочет знать, влияет ли на рост растений воздействие солнечного света и частота полива. Она сажает 40 семян и дает им расти в течение одного месяца при различных условиях солнечного света и частоты полива.

Через месяц она записывает высоту каждого растения. Результаты показаны ниже:

Двусторонняя таблица ANOVA в Excel

В таблице выше мы видим, что в каждой комбинации условий выращивалось по пять растений.

Например, было пять растений, выращенных с ежедневным поливом и без солнечного света, и их высота через два месяца составила 4,8 дюйма, 4,4 дюйма, 3,2 дюйма, 3,9 дюйма и 4,4 дюйма:

Двусторонние данные ANOVA в Excel

Мы можем использовать следующие шаги для выполнения двустороннего ANOVA:

Шаг 1: Рассчитайте сумму квадратов для первого фактора (частота полива)

Во-первых, мы рассчитаем общую среднюю высоту всех 40 растений:

Общее среднее = (4,8 + 5 + 6,4 + 6,3 + … + 3,9 + 4,8 + 5,5 + 5,5) / 40 = 5,1525

Далее рассчитаем среднюю высоту всех ежедневно поливаемых растений:

Среднее значение дня = (4,8 + 5 + 6,4 + 6,3 + … + 4,4 + 4,8 + 5,8 + 5,8) / 20 = 5,155

Далее мы рассчитаем среднюю высоту всех растений, поливаемых еженедельно:

Среднее значение за неделю = (4,4 + 4,9 + 5,8 + 6 + … + 3,9 + 4,8 + 5,5 + 5,5) / 20 = 5,15

Далее рассчитаем сумму квадратов фактора «частота полива» по следующей формуле:

Σn(X j – X ..) 2

куда:

  • n : размер выборки группы j
  • Σ : греческий символ, означающий «сумма».
  • X j : среднее значение группы j
  • X .. : большая середина

В нашем примере мы вычисляем сумму квадратов для фактора «частота полива»: 20(5,155-5,1525) 2 + 20(5,15-5,1525) 2 = 0,00025

Шаг 2: Рассчитайте сумму квадратов для второго фактора (воздействие солнечного света)

Во-первых, мы рассчитаем общую среднюю высоту всех 40 растений:

Общее среднее = (4,8 + 5 + 6,4 + 6,3 + … + 3,9 + 4,8 + 5,5 + 5,5) / 40 = 5,1525

Далее мы рассчитаем среднюю высоту всех растений без воздействия солнечного света:

Среднее значение без солнечного света = (4,8 + 4,4 + 3,2 + 3,9 + 4,4 + 4,4 + 4,2 + 3,8 + 3,7 + 3,9) / 10 = 4,07

Мы повторим этот расчет, чтобы найти среднюю высоту растений при различном воздействии солнечного света:

  • Среднее значение слабого солнечного света = 5,1
  • Среднее значение среднего солнечного света = 5,89
  • Среднее значение яркого солнечного света = 5,55 .

Далее мы рассчитаем сумму квадратов для фактора «воздействие солнечного света» по следующей формуле:

Σn(X j – X ..) 2

куда:

  • n : размер выборки группы j
  • Σ : греческий символ, означающий «сумма».
  • X j : среднее значение группы j
  • X .. : большая середина

В нашем примере мы вычисляем сумму квадратов для фактора «воздействие солнечного света»: 2 = 18,76475

Шаг 3: вычислить сумму квадратов внутри (ошибка)

Далее мы рассчитаем сумму квадратов внутри, взяв сумму квадратов разностей между каждой комбинацией факторов и высотой отдельных растений.

Например, средняя высота всех растений, ежедневно поливаемых без воздействия солнечного света, составляет 4,14. Затем мы можем рассчитать сумму квадратов разностей для каждого из этих отдельных растений как:

  • СС для ежедневного полива и отсутствия солнечного света: (4,8-4,14) 2 + (4,4-4,14) 2 + (3,2-4,14) 2 + (3,9-4,14) 2 + (4,4-4,14) 2 = 1,512

Мы можем повторить этот процесс для каждой комбинации факторов:

  • SS для ежедневного полива и слабого солнечного света: 0,928
  • СС для ежедневного полива и среднего солнечного света: 1,788
  • СС для ежедневного полива и яркого солнечного света: 1,648
  • SS для еженедельного полива и отсутствия солнечного света: 0,34
  • SS для еженедельного полива и слабого солнечного света: 0,548
  • SS для еженедельного полива и среднего солнечного света: 0,652
  • СС для еженедельного полива и яркого солнечного света: 1,268

Затем мы можем взять сумму всех этих значений, чтобы найти сумму квадратов внутри (ошибка):

Сумма квадратов внутри = 1,512 + 0,928 + 1,788 + 1,648 + 0,34 + 0,548 + 0,652 + 1,268 = 8,684

Шаг 4: вычислить общую сумму квадратов

Затем мы можем рассчитать общую сумму квадратов, взяв сумму разностей между высотой каждого отдельного растения и средним значением:

Общая сумма квадратов = (4,8 – 5,1525) 2 + (5 – 5,1525) 2 + … + (5,5 – 5,1525) 2 = 28,45975

Шаг 5: вычислить сумму взаимодействия квадратов

Далее мы рассчитаем сумму взаимодействия квадратов по следующей формуле:

  • Взаимодействие SS = Всего SS – Фактор SS 1 – Фактор SS 2 – SS в пределах
  • Взаимодействие СС = 28,45975 – 0,00025 – 18,76475 – 8,684
  • Взаимодействие СС = 1,01075

Шаг 6: Заполните таблицу ANOVA

Наконец, мы заполним значения для двусторонней таблицы ANOVA:

Вот как мы рассчитали различные числа в таблице:

  • df Частота полива: j-1 = 2-1 = 1
  • df Воздействие солнечного света: k-1 = 4-1 = 3
  • df Взаимодействие : (j-1)*(k-1) = 1*3 = 3
  • df Внутри : n – (j*k) = 40 – (2*4) = 32
  • df всего: n-1 = 40-1 = 39
  • МС: СС/дф
  • F Частота полива: Частота полива MS / MS в пределах
  • F Воздействие солнечного света : МС Воздействие солнечного света / МС внутри
  • F-взаимодействие : MS-взаимодействие / MS внутри
  • p-value Частота полива : p-значение, соответствующее значению F, равному 0,000921, с числителем df = 1 и знаменателем df = 32.
  • Воздействие солнечного света p-value : p-значение, соответствующее значению F, равному 23,04898, с числителем df = 3 и знаменателем df = 32.
  • Взаимодействие p-значения : значение p, соответствующее значению F, равному 1,241517, с числителем df = 3 и знаменателем df = 32.

Примечание №1: n = общее количество наблюдений, j = количество уровней частоты полива, k = количество уровней воздействия солнечного света.

Примечание № 2. Значения p, соответствующие F-значению, были рассчитаны с использованием калькулятора F-распределения .

Шаг 7: интерпретируйте результаты

Из таблицы ANOVA мы можем наблюдать следующее:

  • Значение p для взаимодействия между частотой полива и воздействием солнечного света составило 0,311.Это не является статистически значимым при α = 0,05.
  • Значение p для частоты полива составило 0,975.Это не является статистически значимым при α = 0,05.
  • Значение p для воздействия солнечного света было <0,000.Это статистически значимо при α = 0,05.

Эти результаты показывают, что воздействие солнечного света является единственным фактором, статистически значимо влияющим на высоту растений.

А поскольку эффекта взаимодействия нет, эффект воздействия солнечного света одинаков для каждого уровня частоты полива.

То есть, поливают ли растение ежедневно или еженедельно, это не влияет на то, как воздействие солнечного света влияет на растение.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию об ANOVA:

Как выполнить однофакторный дисперсионный анализ вручную
Как выполнить дисперсионный анализ с повторными измерениями вручную
Полное руководство: как сообщать о результатах двухфакторного дисперсионного анализа

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.