Как рассчитать стандартную ошибку Bootstrap в R


Начальная загрузка — это метод, который можно использовать для оценки стандартной ошибки среднего значения.

Базовый процесс расчета стандартной ошибки начальной загрузки выглядит следующим образом:

  • Возьмите k повторных выборок с заменой из заданного набора данных.
  • Для каждого образца рассчитайте стандартную ошибку: s/ √n
  • Это приводит к k различным оценкам стандартной ошибки. Чтобы найти стандартную ошибку начальной загрузки, возьмите среднее значение k стандартных ошибок.

В следующих примерах объясняются два разных метода, которые можно использовать для вычисления стандартной ошибки начальной загрузки в R.

Способ 1: использовать загрузочный пакет

Один из способов вычислить стандартную ошибку начальной загрузки в R — использовать функцию boot() из библиотеки загрузки .

В следующем коде показано, как рассчитать стандартную ошибку начальной загрузки для заданного набора данных в R:

#make this example reproducible
set. seed (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics :
 original bias std. error
t1\* 21.5 0.254 2.379263

«Исходное» значение 21,5 показывает среднее значение исходного набора данных. «Стд. error» значение 2,379263 показывает стандартную ошибку начальной загрузки среднего значения.

Обратите внимание, что мы использовали 100 выборок с начальной загрузкой для оценки стандартной ошибки среднего в этом примере, но мы могли бы использовать 1000 или 10 000 или любое количество выборок с начальной загрузкой, которое нам нужно.

Способ 2: напишите свою собственную формулу

Другой способ вычислить стандартную ошибку начальной загрузки — написать собственную функцию.

Следующий код показывает, как это сделать:

#make this example reproducible
set. seed (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

Стандартная ошибка начальной загрузки оказывается равной 2.497414 .

Обратите внимание, что эта стандартная ошибка очень похожа на вычисленную в предыдущем примере.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.