Самый распространенный способ сравнить средние между двумя независимыми группами — использовать t-критерий с двумя выборками.Однако этот тест предполагает, что дисперсии между двумя группами равны.
Если вы подозреваете, что дисперсия между двумя группами неодинакова , вы можете вместо этого использовать t-критерий Уэлча , который является непараметрическим эквивалентом t-теста для двух выборок.
В этом руководстве объясняется, как выполнить t-критерий Уэлча в Stata.
Пример: t-критерий Уэлча в Stata
В этом примере мы будем использовать набор данных Fuel3 , который содержит данные о милях на галлон 12 автомобилей, которые прошли определенную обработку топлива, и 12 автомобилей, которые не прошли.
Используйте следующие шаги, чтобы выполнить t-критерий Велча, чтобы определить, есть ли разница в среднем показателе миль на галлон между двумя группами.
Шаг 1: Загрузите и просмотрите данные.
Сначала загрузите набор данных, введя следующую команду в поле «Команда»:
используйте http://www.stata-press.com/data/r13/fuel3
Просмотрите необработанные данные с помощью следующей команды:
список

Шаг 2: Визуализируйте данные.
Прежде чем мы выполним t-критерий Уэлча, давайте сначала создадим две диаграммы , чтобы визуализировать распределение миль на галлон для каждой группы:
графическая коробка миль на галлон, более(обработанный)

Мы можем видеть, что расход топлива для группы 1 (группа, прошедшая обработку топливом) имеет тенденцию быть выше, чем для группы 0. Мы также можем видеть, что дисперсия для группы 1 выглядит немного меньше, чем для группы 0 (группа 0). ширина коробки меньше).
Шаг 3. Выполните t-критерий Уэлча.
Используйте следующий синтаксис для выполнения t-критерия Уэлча:
ttest variable_to_measure, by(grouping_variable) welch
Вот синтаксис для нашего конкретного примера:
ttest миль на галлон, (обработанный) Уэлч

Вот как интерпретировать вывод:
- Среднее значение миль на галлон для группы 0 составило 21 миля на галлон. 95% доверительный интервал для истинного среднего значения генеральной совокупности был (19,26525, 22,73745) .
- Средний расход топлива для группы 1 составил 22,75 мили на галлон. 95% доверительный интервал для истинного среднего значения генеральной совокупности был (20,68449, 24,81551) .
- Средняя разница в милях на галлон для группы 0 и группы 1 составила -1,75.95% доверительный интервал для истинной разницы в средних популяции был (-4,28369, 0,7836902) .
- Тестовая статистика t для t-критерия Уэлча была -1,4280 .
- Поскольку нас интересует альтернативная гипотеза о том, что средний расход топлива в милях на галлон просто отличался между двумя группами, мы рассмотрим значение p, связанное с Ha: diff != 0, которое оказывается равным 0,1666.Поскольку это значение не менее 0,05, у нас нет достаточных оснований утверждать, что средний расход топлива между двумя группами отличается.
Шаг 4: Сообщите о результатах.
Наконец, мы хотим сообщить о результатах нашего t-критерия Уэлча. Вот пример того, как это сделать:
Стьюдентный критерий Уэлча был выполнен, чтобы определить, была ли статистически значимая разница в милях на галлон между группой автомобилей, подвергшихся обработке топливом, и группой, которая этого не сделала. Объем выборки для обеих групп составил 12 автомобилей.
Стьюдентный критерий Уэлча показал, что между двумя группами не было статистически значимой разницы в средних значениях (t = -1,4280, p = 0,1666).
Было обнаружено, что 95% доверительный интервал для истинной средней разницы в группе 0 (группа без лечения) и группе 1 (группа лечения) составляет (-4,28369, 0,7836902).