Как применить центральную предельную теорему в R (с примерами)

Как применить центральную предельную теорему в R (с примерами)

Центральная предельная теорема утверждает, что выборочное распределение среднего значения выборки приблизительно нормально, если размер выборки достаточно велик, даже если распределение совокупности не является нормальным.

Центральная предельная теорема также утверждает, что выборочное распределение будет иметь следующие свойства:

1. Среднее значение выборочного распределения будет равно среднему значению распределения генеральной совокупности:

х = μ

2. Стандартное отклонение выборочного распределения будет равно стандартному отклонению распределения генеральной совокупности, деленному на объем выборки:

с = σ /n

Следующий пример демонстрирует, как применить центральную предельную теорему в R.

Пример: применение центральной предельной теоремы в R

Предположим, что ширина панциря черепахи равномерно распределена с минимальной шириной 2 дюйма и максимальной шириной 6 дюймов.

То есть, если мы случайным образом выберем черепаху и измерим ширину ее панциря, с одинаковой вероятностью это будет любая ширина от 2 до 6 дюймов.

В следующем коде показано, как создать набор данных в R, содержащий измерения ширины панциря 1000 черепах, равномерно распределенных между 2 и 6 дюймами:

#make this example reproducible
set. seed (0)

#create random variable with sample size of 1000 that is uniformally distributed
data <- runif(n=1000, min=2, max=6)

#create histogram to visualize distribution of turtle shell widths
hist(data, col='steelblue', main='Histogram of Turtle Shell Widths')

Обратите внимание, что распределение ширины панциря черепах вообще не является нормальным.

Теперь представьте, что мы берем повторяющиеся случайные выборки из 5 черепах из этой популяции и снова и снова измеряем среднее значение выборки.

В следующем коде показано, как выполнить этот процесс в R и создать гистограмму для визуализации распределения выборочных средних:

#create empty vector to hold sample means
sample5 <- c()

#take 1,000 random samples of size n=5
n = 1000
for (i in 1:n){
sample5[i] = mean(sample(data, 5, replace= TRUE ))
}

#calculate mean and standard deviation of sample means
mean(sample5)

[1] 4.008103

sd(sample5)

[1] 0.5171083 

#create histogram to visualize sampling distribution of sample means
hist(sample5, col ='steelblue', xlab='Turtle Shell Width', main='Sample size = 5') 

Обратите внимание, что выборочное распределение выборочных средних кажется нормально распределенным, хотя распределение, из которого взяты выборки, не было нормально распределенным.

Также обратите внимание на среднее значение выборки и стандартное отклонение выборки для этого выборочного распределения:

  • х̄ : 4,008
  • с : 0,517

Теперь предположим, что мы увеличили размер используемой выборки с n=5 до n=30 и воссоздали гистограмму выборочных средних:

#create empty vector to hold sample means
sample30 <- c()

#take 1,000 random samples of size n=30
n = 1000
for (i in 1:n){
sample30[i] = mean(sample(data, 30, replace= TRUE ))
}

#calculate mean and standard deviation of sample means
mean(sample30)

[1] 4.000472

sd(sample30)

[1] 0.2003791

#create histogram to visualize sampling distribution of sample means
hist(sample30, col ='steelblue', xlab='Turtle Shell Width', main='Sample size = 30') 

Распределение выборки снова нормально распределено , но стандартное отклонение выборки еще меньше:

  • с : 0,200

Это связано с тем, что мы использовали больший размер выборки (n = 30) по сравнению с предыдущим примером (n = 5), поэтому стандартное отклонение выборочных средних еще меньше.

Если мы будем продолжать использовать все большие и большие размеры выборки, мы обнаружим, что стандартное отклонение выборки становится все меньше и меньше.

Это иллюстрирует центральную предельную теорему на практике.

Дополнительные ресурсы

Следующие ресурсы предоставляют дополнительную информацию о центральной предельной теореме:

Введение в центральную предельную теорему
Калькулятор центральной предельной теоремы
5 примеров использования центральной предельной теоремы в реальной жизни

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.