Что означает высокое значение F в ANOVA?


Односторонний дисперсионный анализ используется для определения того, равны ли средние значения трех или более независимых групп.

Однофакторный дисперсионный анализ использует следующие нулевую и альтернативную гипотезы:

  • H 0 : Все средние группы равны.
  • H A : По крайней мере одно среднее значение группы отличается от остальных.

Всякий раз, когда вы выполняете односторонний ANOVA, вы получите сводную таблицу, которая выглядит следующим образом:

| Источник | Сумма квадратов (СС) | дф | Средние квадраты (MS) | Ф | P-значение | | --- | --- | --- | --- | --- | --- | | Уход | 192,2 | 2 | 96,1 | 2,358 | 0,1138 | | Ошибка | 1100,6 | 27 | 40,8 |  |  | | Общий | 1292,8 | 29 |  |  |  |

Значение F в таблице рассчитывается как:

  • F-значение = Обработка средних квадратов / Ошибка средних квадратов

Другой способ написать это выглядит следующим образом:

  • F-значение = вариация между средними значениями выборки / вариация внутри выборок

Если вариация между выборочными средними высока по сравнению с вариацией внутри каждой из выборок, то F-значение будет большим.

Например, значение F в приведенной выше таблице рассчитывается как:

  • F-значение = 96,1 / 40,8 = 2,358

Чтобы найти p-значение , соответствующее этому F-значению, мы можем использовать калькулятор F-распределения со степенями свободы в числителе = df Treatment и степенями свободы в знаменателе = df Error.

Например, p-значение, соответствующее F-значению 2,358, числителю df = 2 и знаменателю df = 27, равно 0,1138 .

Поскольку это p-значение не меньше α = 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что нет статистически значимой разницы между средними значениями трех групп.

Визуализация F-значения дисперсионного анализа

Чтобы получить интуитивное представление о F-значении в таблице ANOVA, рассмотрим следующий пример.

Предположим, мы хотим выполнить однофакторный дисперсионный анализ, чтобы определить, дают ли три разных метода обучения разные средние баллы на экзаменах. В следующей таблице показаны экзаменационные баллы 10 студентов, использовавших каждый метод:

Мы можем создать следующий график, чтобы визуализировать результаты экзаменов по группам:

Вариация внутри выборки представлена разбросом значений в каждой отдельной выборке:

Различия между выборками представлены различиями между выборочными средними:

Выполнив однофакторный дисперсионный анализ для этого набора данных, мы обнаруживаем, что значение F равно 2,358 , а соответствующее значение p равно 0,1138 .

Поскольку это p-значение не меньше 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств того, что используемая методика обучения вызывает статистически значимые различия в средних результатах экзаменов.

Другими словами, это говорит нам о том, что вариация между выборочными средними недостаточно высока по сравнению с вариацией внутри выборок, чтобы отвергнуть нулевую гипотезу.

Вывод

Вот краткое изложение основных моментов в этой статье:

  • Значение F в дисперсионном анализе рассчитывается как: вариация между средними значениями выборки / вариация внутри выборок.
  • Чем выше значение F в дисперсионном анализе, тем выше вариация между выборочными средними по сравнению с вариациями внутри выборок.
  • Чем выше значение F, тем ниже соответствующее значение p.
  • Если p-значение ниже определенного порога (например, α = 0,05), мы можем отклонить нулевую гипотезу дисперсионного анализа и сделать вывод о наличии статистически значимой разницы между средними группами.

Дополнительные ресурсы

Как выполнить однофакторный дисперсионный анализ в Excel
Как выполнить однофакторный дисперсионный анализ вручную
Калькулятор однофакторного дисперсионного анализа