Как выполнить двухвыборочный t-тест в Stata

Как выполнить двухвыборочный t-тест в Stata

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.

В этом руководстве объясняется, как провести t-тест с двумя выборками в Stata.

Пример: двухвыборочный t-критерий в Stata

Исследователи хотят знать, приводит ли новая обработка топлива к изменению среднего расхода топлива на галлон определенного автомобиля. Чтобы проверить это, они проводят эксперимент, в котором 12 автомобилей получают новую обработку топлива, а 12 автомобилей - нет.

Выполните следующие шаги, чтобы провести t-критерий с двумя выборками, чтобы определить, есть ли разница в среднем показателе миль на галлон между этими двумя группами.

Шаг 1: Загрузите данные.

Сначала загрузите данные, введя use http://www.stata-press.com/data/r13/fuel3 в поле команды и нажав Enter.

Двухвыборочный t-тест в примере Stata

Шаг 2: Просмотрите необработанные данные.

Прежде чем мы выполним t-тест с двумя выборками, давайте сначала просмотрим необработанные данные. В верхней строке меню выберите Данные > Редактор данных > Редактор данных (Обзор).Первый столбец, mpg , показывает mpg для данного автомобиля. Второй столбец, обработанный , указывает, прошел ли автомобиль обработку топлива (0 = нет, 1 = да).

Просмотр необработанных данных в Stata

Шаг 3: Визуализируйте данные.

Далее, давайте визуализируем данные. Мы создадим диаграммы для просмотра распределения значений миль на галлон для каждой группы.

В верхней строке меню перейдите к Graphics > Box plot.В переменных выберите mpg :

Затем в подзаголовке «Категории» в разделе «Переменная группировки» выберите « обработано »:

Нажмите ОК.Автоматически отобразится диаграмма с двумя диаграммами:

Бок-бокс-плоты в Stata

Сразу видно, что показатель расхода на галлон в обработанной группе (1) выше, чем в необработанной группе (0), но нам нужно провести двухвыборочный t-тест, чтобы увидеть, являются ли эти различия статистически значимыми. .

Шаг 4: Выполните t-критерий с двумя выборками.

В верхней строке меню выберите Статистика > Сводки, таблицы и тесты > Классические проверки гипотез > t-тест (критерий сравнения средних) .

Выберите Two-sample using groups.В качестве имени переменной выберите mpg.В качестве имени переменной группы выберите обработанный.В качестве уровня уверенности выберите любой желаемый уровень. Значение 95 соответствует уровню значимости 0,05. Мы оставим это значение равным 95. Наконец, нажмите OK .

Пример t-теста с двумя выборками в Stata

Будут отображены результаты двух выборочных t-тестов:

Двухвыборочный t-критерий в интерпретации Stata

Для каждой группы нам дана следующая информация:

Obs: количество наблюдений. В каждой группе по 12 наблюдений.

Среднее значение: средний показатель миль на галлон. В группе 0 среднее значение равно 21. В группе 1 среднее значение равно 22,75.

стандарт Err: стандартная ошибка, рассчитанная как σ / √ n

стандарт Dev: стандартное отклонение миль на галлон.

95% Конф. Интервал: 95% доверительный интервал для истинного среднего значения миль на галлон для населения.

t: тестовая статистика двухвыборочного t-критерия.

Степени свободы: Степени свободы, используемые для теста, рассчитанные как n-2 = 24-2 = 22.

Значения p для трех разных двухвыборочных t-тестов отображаются внизу результатов. Поскольку мы заинтересованы в том, чтобы понять, отличается ли просто среднее значение расхода на галлон между двумя группами, мы рассмотрим результаты среднего теста (в котором альтернативной гипотезой является Ha: diff !=0), который имеет p-значение 0,1673. .

Поскольку это значение не меньше нашего уровня значимости 0,05, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что истинное среднее значение расхода на галлон отличается между двумя группами.

Шаг 5: Сообщите о результатах.

Наконец, мы сообщим о результатах нашего двухвыборочного t-теста. Вот пример того, как это сделать:

Стьюдентный тест с двумя образцами был проведен на 24 автомобилях, чтобы определить, приводит ли новая обработка топлива к разнице в среднем количестве миль на галлон. В каждой группе было по 12 автомобилей.
Результаты показали, что средний показатель миль на галлон между двумя группами не различался (t = -1,428 w/df = 22, p = 0,1673) при уровне значимости 0,05.
95% доверительный интервал для истинной разницы в средних популяции дал интервал (-4,29, 0,79).
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.