Как рассчитать объединенную дисперсию в R

Как рассчитать объединенную дисперсию в R

В статистике объединенная дисперсия относится к среднему значению двух или более групповых дисперсий.

Мы используем слово «объединенные», чтобы указать, что мы «объединяем» две или более групповые дисперсии, чтобы получить единое число для общей дисперсии между группами.

На практике объединенная дисперсия чаще всего используется в двухвыборочном t-тесте , который используется для определения того, равны ли две средние значения совокупности.

Объединенная дисперсия между двумя выборками обычно обозначается как s p 2 и рассчитывается как:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

К сожалению, в R нет встроенной функции для вычисления объединенной дисперсии между двумя группами, но мы можем вычислить ее довольно легко.

Например, предположим, что мы хотим рассчитать объединенную дисперсию между следующими двумя группами:

В следующем коде показано, как вычислить объединенную дисперсию между этими группами в R:

#define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)\*var1 + (n2-1)\*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Суммарная дисперсия между этими двумя группами оказывается равной 46,97143 .

Дополнительные ресурсы

Что такое объединенная дисперсия? (Определение и пример)
Калькулятор объединенной дисперсии
Как рассчитать объединенную дисперсию в Excel

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.