Что означает высокое значение F в ANOVA?

Что означает высокое значение F в ANOVA?

Односторонний дисперсионный анализ используется для определения того, равны ли средние значения трех или более независимых групп.

Однофакторный дисперсионный анализ использует следующие нулевую и альтернативную гипотезы:

  • H 0 : Все средние группы равны.
  • H A : По крайней мере одно среднее значение группы отличается от остальных.

Всякий раз, когда вы выполняете односторонний ANOVA, вы получите сводную таблицу, которая выглядит следующим образом:

| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | P-значение | | --- | --- | --- | --- | --- | --- | | Уход | 192,2 | 2 | 96,1 | 2,358 | 0,1138 | | Ошибка | 1100,6 | 27 | 40,8 |  |  | | Общий | 1292,8 | 29 |  |  |  |

Значение F в таблице рассчитывается как:

  • F-значение = Обработка средних квадратов / Ошибка средних квадратов

Другой способ написать это выглядит следующим образом:

  • F-значение = вариация между средними значениями выборки / вариация внутри выборок

Если вариация между выборочными средними высока по сравнению с вариацией внутри каждой из выборок, то F-значение будет большим.

Например, значение F в приведенной выше таблице рассчитывается как:

  • F-значение = 96,1 / 40,8 = 2,358

Чтобы найти p-значение , соответствующее этому F-значению, мы можем использовать калькулятор F-распределения со степенями свободы в числителе = df Treatment и степенями свободы в знаменателе = df Error.

Например, p-значение, соответствующее F-значению 2,358, числителю df = 2 и знаменателю df = 27, равно 0,1138 .

Поскольку это p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что нет статистически значимой разницы между средними значениями трех групп.

Визуализация F-значения дисперсионного анализа

Чтобы получить интуитивное представление о F-значении в таблице ANOVA, рассмотрим следующий пример.

Предположим, мы хотим выполнить однофакторный дисперсионный анализ, чтобы определить, дают ли три разных метода обучения разные средние баллы на экзаменах. В следующей таблице показаны экзаменационные баллы 10 студентов, использовавших каждый метод:

Мы можем создать следующий график, чтобы визуализировать результаты экзаменов по группам:

Вариация внутри выборки представлена разбросом значений в каждой отдельной выборке:

Различия между выборками представлены различиями между выборочными средними:

Выполнив однофакторный дисперсионный анализ для этого набора данных, мы обнаруживаем, что значение F равно 2,358 , а соответствующее значение p равно 0,1138 .

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что используемая методика обучения вызывает статистически значимые различия в средних результатах экзаменов.

Другими словами, это говорит нам о том, что вариация между выборочными средними недостаточно высока по сравнению с вариацией внутри выборок, чтобы отвергнуть нулевую гипотезу.

Вывод

Вот краткое изложение основных моментов в этой статье:

  • Значение F в дисперсионном анализе рассчитывается как: вариация между средними значениями выборки / вариация внутри выборок.
  • Чем выше значение F в дисперсионном анализе, тем выше вариация между выборочными средними по сравнению с вариациями внутри выборок.
  • Чем выше значение F, тем ниже соответствующее значение p.
  • Если p-значение ниже определенного порога (например, α = 0,05), мы можем отклонить нулевую гипотезу дисперсионного анализа и сделать вывод о наличии статистически значимой разницы между средними группами.

Дополнительные ресурсы

Как выполнить однофакторный дисперсионный анализ в Excel
Как выполнить однофакторный дисперсионный анализ вручную
Калькулятор однофакторного дисперсионного анализа

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.