Однофакторный дисперсионный анализ: определение, формула и пример

Однофакторный дисперсионный анализ: определение, формула и пример

Однофакторный дисперсионный анализ («дисперсионный анализ») сравнивает средние значения трех или более независимых групп, чтобы определить, существует ли статистически значимая разница между соответствующими средними значениями генеральной совокупности.

В этом руководстве объясняется следующее:

  • Мотивация для выполнения однофакторного дисперсионного анализа.
  • Допущения, которые должны быть соблюдены для выполнения однофакторного дисперсионного анализа.
  • Процесс выполнения однофакторного дисперсионного анализа.
  • Пример выполнения однофакторного дисперсионного анализа.

Однофакторный дисперсионный анализ: мотивация

Предположим, мы хотим узнать, приводят ли три разные программы подготовки к экзаменам к разным средним баллам на вступительном экзамене в колледж. Поскольку по всей стране проживают миллионы старшеклассников, было бы слишком много времени и денег, чтобы обратиться к каждому ученику и позволить им использовать одну из программ подготовки к экзаменам.

Вместо этого мы могли бы выбрать три случайные выборки из 100 студентов из населения и позволить каждой выборке использовать одну из трех программ подготовки к экзамену для подготовки к экзамену. Затем мы могли бы записывать баллы для каждого студента после сдачи экзамена.

Отбор образцов из популяции

Однако практически гарантировано, что средний балл за экзамен между тремя выборками будет хотя бы немного отличаться. Вопрос в том, является ли эта разница статистически значимой.К счастью, однофакторный дисперсионный анализ позволяет нам ответить на этот вопрос.

Однофакторный дисперсионный анализ: предположения

Чтобы результаты однофакторного дисперсионного анализа были достоверными, должны выполняться следующие допущения:

1. Нормальность. Каждая выборка была взята из нормально распределенной популяции.

2. Равные дисперсии — дисперсии совокупностей, из которых взяты выборки, равны. Вы можете использовать тест Бартлетта, чтобы проверить это предположение.

3. Независимость.Наблюдения в каждой группе независимы друг от друга, а наблюдения внутри групп были получены путем случайной выборки.

Прочтите эту статью , чтобы получить подробную информацию о том, как проверить эти предположения.

Однофакторный дисперсионный анализ: процесс

Однофакторный дисперсионный анализ использует следующие нулевую и альтернативную гипотезы:

  • H 0 (нулевая гипотеза): µ 1 = µ 2 = µ 3 = … = µ k (все средние значения совокупности равны)
  • H 1 (альтернативная гипотеза): по крайней мере одно среднее значение популяции отличаетсяот остальных

Обычно вы будете использовать какое-либо статистическое программное обеспечение (такое как R, Excel, Stata, SPSS и т. д.) для выполнения однофакторного дисперсионного анализа, поскольку выполнять его вручную неудобно.

Независимо от того, какое программное обеспечение вы используете, в качестве вывода вы получите следующую таблицу:

| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | п | | --- | --- | --- | --- | --- | --- | | Уход | ССР | дф р | МСР | МСР/МСЭ | F df r , df е | | Ошибка | ССЭ | дф е | MSE |  |  | | Общий | SST | дф т |  |  |  |

куда:

  • SSR: сумма квадратов регрессии
  • SSE: сумма квадратов ошибок
  • SST: общая сумма квадратов (SST = SSR + SSE)
  • df r : степени свободы регрессии (df r = k-1)
  • df e : ошибки степеней свободы (df e = nk)
  • df t : общее количество степеней свободы (df t = n-1)
  • k: общее количество групп
  • n: общее количество наблюдений
  • MSR: средний квадрат регрессии (MSR = SSR/df r )
  • MSE: среднеквадратическая ошибка (MSE = SSE/df e )
  • F: статистика F-теста (F = MSR/MSE).
  • p: значение p, соответствующее F dfr, dfe

Если p-значение меньше выбранного вами уровня значимости (например, 0,05), то вы можете отклонить нулевую гипотезу и сделать вывод, что по крайней мере одно из средних значений генеральной совокупности отличается от других.

Примечание. Если вы отклоняете нулевую гипотезу, это означает, что по крайней мере одно из средних значений совокупности отличается от других, но таблица ANOVA не указывает , какие средние значения совокупности отличаются. Чтобы определить это, вам необходимо выполнить апостериорные тесты , также известные как тесты «множественных сравнений».

Однофакторный дисперсионный анализ: пример

Предположим, мы хотим знать, приводят ли три разные программы подготовки к экзаменам к разным средним баллам на определенном экзамене. Чтобы проверить это, мы набираем 30 студентов для участия в исследовании и разделяем их на три группы.

Студенты в каждой группе случайным образом назначаются для использования одной из трех программ подготовки к экзамену в течение следующих трех недель для подготовки к экзамену. По истечении трех недель все студенты сдают один и тот же экзамен.

Ниже представлены результаты экзаменов для каждой группы:

Пример однофакторных данных ANOVA

Чтобы выполнить однофакторный дисперсионный анализ этих данных, мы будем использовать калькулятор однофакторного дисперсионного анализа Statology со следующими входными данными:

Пример расчета однофакторного дисперсионного анализа

Из выходной таблицы мы видим, что статистика F-теста равна 2,358 , а соответствующее значение p равно 0,11385 .

Интерпретация выходной таблицы ANOVA

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает , что у нас нет достаточных доказательств, чтобы сказать, что существует статистически значимая разница между средними экзаменационными баллами трех групп.

Дополнительные ресурсы

В следующих статьях объясняется, как выполнить однофакторный дисперсионный анализ с использованием различных статистических программ:

Как выполнить однофакторный дисперсионный анализ в Excel
Как выполнить односторонний ANOVA в R
Как выполнить односторонний ANOVA в Python
Как выполнить односторонний ANOVA в SAS
Как выполнить однофакторный дисперсионный анализ в SPSS
Как выполнить односторонний ANOVA в Stata
Как выполнить однофакторный дисперсионный анализ на калькуляторе TI-84
Онлайн-калькулятор однофакторного дисперсионного анализа

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.