Как выполнить t-тест Уэлча в Stata

Как выполнить t-тест Уэлча в Stata

Самый распространенный способ сравнить средние между двумя независимыми группами — использовать t-критерий с двумя выборками.Однако этот тест предполагает, что дисперсии между двумя группами равны.

Если вы подозреваете, что дисперсия между двумя группами неодинакова , вы можете вместо этого использовать t-критерий Уэлча , который является непараметрическим эквивалентом t-теста для двух выборок.

В этом руководстве объясняется, как выполнить t-критерий Уэлча в Stata.

Пример: t-критерий Уэлча в Stata

В этом примере мы будем использовать набор данных Fuel3 , который содержит данные о милях на галлон 12 автомобилей, которые прошли определенную обработку топлива, и 12 автомобилей, которые не прошли.

Используйте следующие шаги, чтобы выполнить t-критерий Велча, чтобы определить, есть ли разница в среднем показателе миль на галлон между двумя группами.

Шаг 1: Загрузите и просмотрите данные.

Сначала загрузите набор данных, введя следующую команду в поле «Команда»:

используйте http://www.stata-press.com/data/r13/fuel3

Просмотрите необработанные данные с помощью следующей команды:

список
Пример команды списка в Stata

Шаг 2: Визуализируйте данные.

Прежде чем мы выполним t-критерий Уэлча, давайте сначала создадим две диаграммы , чтобы визуализировать распределение миль на галлон для каждой группы:

графическая коробка миль на галлон, более(обработанный)
Блочные диаграммы в Stata

Мы можем видеть, что расход топлива для группы 1 (группа, прошедшая обработку топливом) имеет тенденцию быть выше, чем для группы 0. Мы также можем видеть, что дисперсия для группы 1 выглядит немного меньше, чем для группы 0 (группа 0). ширина коробки меньше).

Шаг 3. Выполните t-критерий Уэлча.

Используйте следующий синтаксис для выполнения t-критерия Уэлча:

ttest variable_to_measure, by(grouping_variable) welch

Вот синтаксис для нашего конкретного примера:

ttest миль на галлон, (обработанный) Уэлч
Вывод t-теста Уэлча в Stata

Вот как интерпретировать вывод:

  • Среднее значение миль на галлон для группы 0 составило 21 миля на галлон. 95% доверительный интервал для истинного среднего значения генеральной совокупности был (19,26525, 22,73745) .
  • Средний расход топлива для группы 1 составил 22,75 мили на галлон. 95% доверительный интервал для истинного среднего значения генеральной совокупности был (20,68449, 24,81551) .
  • Средняя разница в милях на галлон для группы 0 и группы 1 составила -1,75.95% доверительный интервал для истинной разницы в средних популяции был (-4,28369, 0,7836902) .
  • Тестовая статистика t для t-критерия Уэлча была -1,4280 .
  • Поскольку нас интересует альтернативная гипотеза о том, что средний расход топлива в милях на галлон просто отличался между двумя группами, мы рассмотрим значение p, связанное с Ha: diff != 0, которое оказывается равным 0,1666.Поскольку это значение не менее 0,05, у нас нет достаточных оснований утверждать, что средний расход топлива между двумя группами отличается.

Шаг 4: Сообщите о результатах.

Наконец, мы хотим сообщить о результатах нашего t-критерия Уэлча. Вот пример того, как это сделать:

Стьюдентный критерий Уэлча был выполнен, чтобы определить, была ли статистически значимая разница в милях на галлон между группой автомобилей, подвергшихся обработке топливом, и группой, которая этого не сделала. Объем выборки для обеих групп составил 12 автомобилей.
Стьюдентный критерий Уэлча показал, что между двумя группами не было статистически значимой разницы в средних значениях (t = -1,4280, p = 0,1666).
Было обнаружено, что 95% доверительный интервал для истинной средней разницы в группе 0 (группа без лечения) и группе 1 (группа лечения) составляет (-4,28369, 0,7836902).
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.