В чем разница между Т-тестом и дисперсионным анализом?


В этом руководстве объясняется разница между t-критерием и дисперсионным анализом , а также когда следует использовать каждый тест.

Т-тест

Стьюдентный критерий используется для определения того, существует ли статистически значимая разница между средними значениями двух групп.Существует два типа t-тестов:

1. Стьюдентный критерий независимых выборок. Это используется, когда мы хотим сравнить разницу между средними значениями двух групп, и группы полностью независимы друг от друга.

Например, исследователи могут захотеть узнать, помогает ли людям сбросить лишний вес диета А или диета Б. 100 случайным образом назначенных людей назначают на диету А. Еще 100 случайно выбранных людей назначают на диету Б. Через три месяца исследователи записывают общую потерю веса для каждого человека. Чтобы определить, существенно ли различается средняя потеря веса между двумя группами, исследователи могут провести t-критерий независимых выборок.

2. Стьюдентный критерий парных выборок.Это используется, когда мы хотим сравнить разницу между средними значениями двух групп и когда каждое наблюдение в одной группе может быть сопряжено с одним наблюдением в другой группе.

Например, предположим, что 20 учащихся в классе проходят тест, затем изучают определенное руководство, а затем пересдают тест. Чтобы сравнить разницу между баллами в первом и втором тесте, мы используем парный t-критерий, потому что для каждого учащегося его балл за первый тест можно сравнить с баллом за второй тест.

Чтобы t-тест дал достоверные результаты, должны выполняться следующие допущения:

  • Случайная выборка: для сбора данных для обеих выборок следует использовать случайную выборку или случайный эксперимент.
  • Нормальное: распределение выборки нормальное или приблизительно нормальное.

Если эти предположения выполняются, то можно безопасно использовать t-критерий для проверки разницы между средними значениями двух групп.

дисперсионный анализ

ANOVA (дисперсионный анализ) используется для определения того, существует ли статистически значимая разница между средними значениями трех или более групп.На практике наиболее часто используемыми тестами ANOVA являются однофакторный и двухфакторный ANOVA:

Однофакторный дисперсионный анализ: используется для проверки наличия статистически значимой разницы между средними значениями трех или более групп, когда группы можно разделить по одному фактору .

Пример. Вы случайным образом разделили класс из 90 учащихся на три группы по 30 человек. Каждая группа в течение одного месяца использует разные методы обучения для подготовки к экзамену. В конце месяца все студенты сдают один и тот же экзамен. Вы хотите знать, влияет ли метод обучения на результаты экзаменов, поэтому вы проводите однофакторный дисперсионный анализ, чтобы определить, есть ли статистически значимая разница между средними баллами трех групп.

Пример одностороннего дисперсионного анализа

Двухфакторный дисперсионный анализ: используется для проверки наличия статистически значимой разницы между средними значениями трех или более групп, когда группы можно разделить на два фактора .

Пример: вы хотите определить, влияют ли уровень упражнений (без упражнений, легкие упражнения, интенсивные упражнения) и пол (мужской, женский) на потерю веса. В этом случае вы изучаете два фактора: физические упражнения и пол, а ваша ответная переменная — потеря веса (измеряемая в фунтах). Вы можете провести двусторонний дисперсионный анализ, чтобы определить, влияют ли физические упражнения и пол на потерю веса, а также определить, есть ли взаимодействие между физическими упражнениями и полом на потерю веса.

Пример двустороннего дисперсионного анализа

Чтобы дисперсионный анализ давал достоверные результаты, должны выполняться следующие допущения:

  • Нормальность — все популяции, которые мы изучаем, имеют нормальное распределение. Так, например, если мы хотим сравнить экзаменационные баллы трех разных групп студентов, экзаменационные баллы для первой группы, второй группы и третьей группы должны быть нормально распределены.
  • Равная дисперсия – дисперсии генеральной совокупности в каждой группе равны или приблизительно равны.
  • Независимость – наблюдения в каждой группе должны быть независимыми друг от друга. Обычно рандомизированный дизайн позаботится об этом.

Если эти предположения выполняются, то можно безопасно использовать дисперсионный анализ для проверки разницы между средними значениями трех или более групп.

Понимание различий между каждым тестом

Основное различие между t-критерием и дисперсионным анализом заключается в том, как эти два теста рассчитывают свою тестовую статистику, чтобы определить, есть ли статистически значимая разница между группами.

Стьюдентный критерий независимых выборок использует следующую тестовую статистику:

тестовая статистика t = [( x 1 - x 2 ) - d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

где x 1 и x 2 — выборочные средние значения для групп 1 и 2, d — предполагаемая разница между двумя средними значениями (часто она равна нулю), s 1 2 и s 2 2 — выборочные дисперсии для групп 1 и 2, и n 1 и n 2 — размеры выборки для групп 1 и 2 соответственно.

Стьюдентный критерий парных выборок использует следующую тестовую статистику:

тестовая статистика t = d / (s d / √n)

где d — средняя разница между двумя группами, s d — стандартное отклонение различий, а n — размер выборки для каждой группы (обратите внимание, что обе группы будут иметь одинаковый размер выборки).

ANOVA использует следующую тестовую статистику:

тестовая статистика F = s 2 b / s 2 w

где s 2 b — межвыборочная дисперсия, а s 2 w — внутривыборочная дисперсия.

Стьюдентный критерий измеряет отношение средней разницы между двумя группами к общему стандартному отклонению различий. Если это соотношение достаточно велико, оно является достаточным доказательством того, что между двумя группами существует значительная разница.

С другой стороны, дисперсионный анализ измеряет отношение дисперсии между группами к дисперсии внутри групп. Подобно t-критерию, если это отношение достаточно велико, оно дает достаточно доказательств того, что не все три группы имеют одинаковое среднее значение.

Еще одно ключевое различие между t-тестом и дисперсионным анализом заключается в том, что t-критерий может сказать нам, имеют ли две группы одинаковое среднее значение. Дисперсионный анализ, с другой стороны, говорит нам, имеют ли все три группы одинаковое среднее значение, но не говорит нам явно, какие группы имеют средние значения, отличные друг от друга.

Чтобы выяснить, какие группы отличаются друг от друга, нам пришлось бы провести апостериорные тесты .

Понимание того, когда использовать каждый тест

На практике, когда мы хотим сравнить средние значения двух групп , мы используем t-критерий. Когда мы хотим сравнить средние значения трех или более групп , мы используем ANOVA.

Основная причина, по которой мы не используем несколько t-тестов просто для сравнения средних значений трех или более групп, восходит к пониманию частоты ошибок первого рода. Предположим, у нас есть три группы, между которыми мы хотим сравнить средние значения: группа A, группа B и группа C. У вас может возникнуть соблазн выполнить следующие три t-теста:

  • Стьюдентный тест для сравнения разницы в средних значениях между группой А и группой В.
  • Стьюдентный тест для сравнения разницы в средних значениях между группой А и группой С.
  • Стьюдентный тест для сравнения разницы в средних значениях между группой B и группой C.

Для каждого t-критерия есть вероятность того, что мы совершим ошибку первого рода , то есть вероятность того, что мы отклоним нулевую гипотезу, когда она действительно верна. Эта вероятность обычно составляет 5%. Это означает, что когда мы выполняем несколько t-тестов, эта частота ошибок увеличивается. Например:

  • Вероятность того, что мы совершим ошибку первого рода с одним t-критерием, составляет 1 – 0,95 = 0,05 .
  • Вероятность того, что мы совершим ошибку первого рода с двумя t-тестами, равна 1 – (0,95 2 ) = 0,0975 .
  • Вероятность того, что мы совершим ошибку первого рода с двумя t-тестами, равна 1 – (0,95 3 ) = 0,1427 .

Эта частота ошибок неприемлемо высока. К счастью, дисперсионный анализ контролирует эти ошибки, так что ошибка типа I остается на уровне всего 5%. Это позволяет нам быть более уверенными в том, что статистически значимый результат теста действительно имеет смысл, а не просто результат, полученный в результате выполнения большого количества тестов.

Таким образом, когда мы хотим понять, есть ли разница между средними значениями трех или более групп, мы должны использовать дисперсионный анализ, чтобы наши результаты были статистически достоверными и надежными.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.