Как рассчитать объединенное стандартное отклонение в R


Объединенное стандартное отклонение — это просто средневзвешенное значение стандартных отклонений от двух или более независимых групп.

В статистике это чаще всего встречается в двухвыборочном t-тесте , который используется для проверки того, равны ли средние значения двух совокупностей.

Формула для расчета объединенного стандартного отклонения для двух групп выглядит следующим образом:

Совокупное стандартное отклонение = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

куда:

  • n 1 , n 2 : размер выборки для группы 1 и группы 2 соответственно.
  • s 1 , s 2 : стандартное отклонение для группы 1 и группы 2 соответственно.

В следующих примерах показаны два метода расчета объединенного стандартного отклонения между двумя группами в R.

Метод 1: рассчитать объединенное стандартное отклонение вручную

Предположим, у нас есть следующие значения данных для двух выборок:

  • Образец 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • Образец 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

Следующий код показывает, как вычислить объединенное стандартное отклонение между этими двумя выборками:

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 <- sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)\*s1^2 + (n2-1)\*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

Объединенное стандартное отклонение оказывается равным 5,789564 .

Метод 2: расчет объединенного стандартного отклонения с использованием пакета

Другой способ вычислить объединенное стандартное отклонение между двумя выборками в R — использовать функцию sd_pooled() из пакета EffectSize .

Следующий код показывает, как использовать эту функцию на практике:

library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

Объединенное стандартное отклонение оказывается равным 5,789564 .

Обратите внимание, что это соответствует значению, которое мы рассчитали вручную в предыдущем примере.

Дополнительные ресурсы

В следующих руководствах содержится дополнительная информация о расчете объединенного стандартного отклонения:

Введение в объединенное стандартное отклонение
Калькулятор объединенного стандартного отклонения

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.