Как провести двухвыборочный t-тест в Excel

Как провести двухвыборочный t-тест в Excel

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.

В этом руководстве объясняется, как провести t-критерий с двумя образцами в Excel.

Как провести двухвыборочный t-тест в Excel

Предположим, исследователи хотят знать, имеют ли два разных вида растений в определенной стране одинаковую среднюю высоту. Поскольку обход и измерение каждого растения заняло бы слишком много времени, они решили собрать образец из 20 растений каждого вида.

На следующем изображении показана высота (в дюймах) каждого растения в каждом образце:

Два примера данных t-теста в Excel

Мы можем провести двухвыборочный t-тест, чтобы определить, имеют ли два вида одинаковую среднюю высоту, используя следующие шаги:

Шаг 1: Определите, равны ли дисперсии генеральной совокупности .

Когда мы проводим двухвыборочный t-критерий, мы должны сначала решить, будем ли мы предполагать, что две совокупности имеют равные или неравные дисперсии. Как правило, мы можем предположить, что совокупности имеют равные дисперсии, если отношение большей выборочной дисперсии к меньшей выборочной дисперсии составляет менее 4:1.

Мы можем найти дисперсию для каждого образца, используя функцию Excel =VAR.S(диапазон ячеек) , как показано на следующем рисунке:

Пример нахождения выборочной дисперсии в Excel

Отношение большей дисперсии выборки к меньшей дисперсии выборки составляет 12,9053 / 8,1342 = 1,586 , что меньше 4. Это означает, что мы можем предположить, что дисперсии генеральной совокупности равны.

Шаг 2: Откройте пакет инструментов анализа .

На вкладке «Данные» на верхней ленте нажмите «Анализ данных».

Пакет инструментов анализа данных в Excel

Если вы не видите этот вариант для выбора, вам необходимо сначала загрузить пакет инструментов анализа , который является совершенно бесплатным.

Шаг 3: Выберите подходящий тест для использования.

Выберите вариант с надписью t-Test: Two-Sample Assassining Equal Variances и нажмите OK.

Два образца t-критерия с пакетом инструментов анализа в Excel

Шаг 4: Введите необходимую информацию .

Введите диапазон значений для переменной 1 (наша первая выборка), переменной 2 (наша вторая выборка), гипотетической средней разницы (в этом случае мы поместили «0», потому что мы хотим знать, равна ли истинная средняя разница генеральной совокупности 0), и выходной диапазон, в котором мы хотели бы видеть результаты t-теста. Затем нажмите ОК.

Двухвыборочный t-критерий с равными дисперсиями в Excel

Шаг 5: интерпретируйте результаты .

После того, как вы нажмете OK на предыдущем шаге, отобразятся результаты t-теста.

Как интерпретировать результаты двухвыборочного t-теста в Excel

Вот как интерпретировать результаты:

Среднее значение: это среднее значение для каждого образца. Образец 1 имеет среднюю высоту 15,15 , а образец 2 имеет среднюю высоту 15,8 .

Дисперсия: это дисперсия для каждого образца. Выборка 1 имеет дисперсию 8,13 , а выборка 2 — 12,90 .

Наблюдения: это количество наблюдений в каждой выборке. Обе выборки содержат по 20 наблюдений (например, по 20 отдельных растений в каждой выборке).

Объединенная дисперсия: Число , которое рассчитывается путем «объединения» дисперсий каждой выборки вместе по формуле +n 2 -2), что оказывается равным 10,51974.Это число позже используется при вычислении тестовой статистики t .

Гипотетическая средняя разница: число, которое мы «предполагаем», представляет собой разницу между двумя средними значениями совокупности. В данном случае мы выбрали 0 , потому что хотим проверить, равна ли разница между двумя популяциями в среднем 0, например, разницы нет.

df: Степени свободы для t-критерия, рассчитанные как n 1 + n 2 -2 = 20 + 20 – 2 = 38 .

t Stat: тестовая статистика t , рассчитанная как t = [ x 1 – x 2 ] / √ [ s 2 p (1/n 1 + 1/n 2 )]

В этом случае t = [15,15-15,8] / √ [10,51974(1/20+1/20)] = -0,63374 .

P(T<=t) двухсторонний: значение p для двустороннего t-критерия. В этом случае р = 0,530047.Это намного больше, чем альфа = 0,05, поэтому мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что два средних значения населения различны.

t Критический двухсторонний: это критическое значение теста, найденное путем определения значения в таблице распределения t , которое соответствует двустороннему тесту с альфа = 0,05 и df = 38. Получается 2,024394.Поскольку наша тестовая статистика t меньше этого значения, мы не можем отвергнуть нулевую гипотезу. У нас нет достаточных доказательств, чтобы сказать, что два средних значения населения различны.

Обратите внимание, что подход с использованием p-значения и критического значения приведет к одному и тому же выводу.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие типы t-тестов в Excel:

Как провести одновыборочный t-тест в Excel
Как провести t-тест для парных выборок в Excel

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.