Объединенное стандартное отклонение — это просто средневзвешенное значение стандартных отклонений от двух или более независимых групп.
В статистике это чаще всего встречается в двухвыборочном t-тесте , который используется для проверки того, равны ли средние значения двух совокупностей.
Формула для расчета объединенного стандартного отклонения для двух групп выглядит следующим образом:
Совокупное стандартное отклонение = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
куда:
- n 1 , n 2 : размер выборки для группы 1 и группы 2 соответственно.
- s 1 , s 2 : стандартное отклонение для группы 1 и группы 2 соответственно.
В следующих примерах показаны два метода расчета объединенного стандартного отклонения между двумя группами в R.
Метод 1: рассчитать объединенное стандартное отклонение вручную
Предположим, у нас есть следующие значения данных для двух выборок:
- Образец 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- Образец 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
Следующий код показывает, как вычислить объединенное стандартное отклонение между этими двумя выборками:
#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)
#find sample standard deviation of each sample
s1 <- sd (data1)
s2 <- sd (data2)
#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)
#calculate pooled standard deviation
pooled <- sqrt (((n1-1)\*s1^2 + (n2-1)\*s2^2) / (n1+n1-2))
#view pooled standard deviation
pooled
[1] 5.789564
Объединенное стандартное отклонение оказывается равным 5,789564 .
Метод 2: расчет объединенного стандартного отклонения с использованием пакета
Другой способ вычислить объединенное стандартное отклонение между двумя выборками в R — использовать функцию sd_pooled() из пакета EffectSize .
Следующий код показывает, как использовать эту функцию на практике:
library (effectsize)
#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)
#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)
[1] 5.789564
Объединенное стандартное отклонение оказывается равным 5,789564 .
Обратите внимание, что это соответствует значению, которое мы рассчитали вручную в предыдущем примере.
Дополнительные ресурсы
В следующих руководствах содержится дополнительная информация о расчете объединенного стандартного отклонения:
Введение в объединенное стандартное отклонение
Калькулятор объединенного стандартного отклонения