Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей.
В этом руководстве представлено полное руководство по интерпретации результатов двухвыборочного t-теста в R.
Шаг 1: Создайте данные
Предположим, мы хотим узнать, имеют ли два разных вида растений одинаковую среднюю высоту. Чтобы проверить это, мы собираем простую случайную выборку из 12 растений каждого вида.
#create vector of plant heights from group 1
group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19)
#create vector of plant heights from group 2
group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
Шаг 2. Выполнение и интерпретация двухвыборочного t-теста
Далее мы воспользуемся командой t.test() для выполнения двухвыборочного t-теста:
#perform two sample t-test
t. test (group1, group2)
Welch Two Sample t-test
data: group1 and group2
t = -2.5505, df = 20.488, p-value = 0.01884
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.6012568 -0.5654098
sample estimates:
mean of x mean of y
11.66667 14.75000
Вот как интерпретировать результаты теста:
данные: это говорит нам о данных, которые использовались в двух выборочных t-тестах. В этом случае мы использовали векторы с именами group1 и group2.
t: Это t-статистика теста. В данном случае это -2,5505 .
df : это степени свободы, связанные со статистикой t-теста. В данном случае это 20.488.Обратитесь к приближению Саттертуэра для объяснения того, как рассчитывается это значение степеней свободы.
p-значение: это p-значение, которое соответствует тестовой статистике -2,5505 и df = 20,488. Значение p оказывается равным 0,01884.Мы можем подтвердить это значение, используя калькулятор T Score to P Value .
альтернативная гипотеза: это говорит нам об альтернативной гипотезе, используемой для этого конкретного t-теста. В этом случае альтернативная гипотеза состоит в том, что истинная разница в средних значениях между двумя группами не равна нулю.
95-процентный доверительный интервал: это говорит нам о 95-процентном доверительном интервале для истинной разницы в средних значениях между двумя группами. Получается [-.5601, -.5654] .
выборочные оценки: это говорит нам о выборочном среднем для каждой группы. В этом случае выборочное среднее для группы 1 составило 11,667 , а выборочное среднее для группы 2 — 14,75 .
Две гипотезы для этого конкретного двухвыборочного t-критерия следующие:
H 0 : µ 1 = µ 2 (две средние совокупности равны)
H A : µ 1 ≠ µ 2 (две средние совокупности не равны)
Поскольку p-значение нашего теста (0,01884) меньше альфа = 0,05, мы отвергаем нулевую гипотезу теста. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средняя высота растений между двумя популяциями различна.
Заметки
Функция t.test() в R использует следующий синтаксис:
t.test(x, y, альтернатива = «двусторонний», mu = 0, парный = FALSE, var.equal = FALSE, conf.level = 0,95)
куда:
- x, y: имена двух векторов, содержащих данные.
- альтернатива: Альтернативная гипотеза. Варианты включают «двусторонний», «меньше» или «больше».
- mu: значение, которое считается истинной разницей в средствах.
- парный: следует ли использовать парный t-тест.
- var.equal: равны ли дисперсии между двумя группами.
- conf.level: уровень достоверности, используемый для теста.
В нашем примере выше мы использовали следующие предположения:
- Мы использовали двустороннюю альтернативную гипотезу.
- Мы проверили, равна ли истинная разница в средних значениях нулю.
- Мы использовали двухвыборочный t-критерий, а не парный t-критерий.
- Мы не делали предположения, что дисперсии были одинаковыми между группами.
- Мы использовали уровень достоверности 95%.
Не стесняйтесь изменять любой из этих аргументов при проведении собственного t-теста в зависимости от конкретного теста, который вы хотите выполнить.
Дополнительные ресурсы
Введение в двухвыборочный t-критерий
Калькулятор t-критерия для двух выборок