Как создать нормальное распределение в R (с примерами)


Вы можете быстро сгенерировать нормальное распределение в R, используя функцию rnorm() , которая использует следующий синтаксис:

rnorm(n, mean=0, sd=1)

куда:

  • n: количество наблюдений.
  • среднее значение: среднее значение нормального распределения. По умолчанию 0.
  • sd: стандартное отклонение нормального распределения. По умолчанию 1.

В этом руководстве показан пример использования этой функции для создания нормального распределения в R.

Связанный: Руководство по dnorm, pnorm, qnorm и rnorm в R

Пример: создание нормального распределения в R

Следующий код показывает, как создать нормальное распределение в R:

#make this example reproducible
set.seed(1)

#generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3
data <- rnorm(200, mean=10, sd=3)

#view first 6 observations in sample
head(data)

[1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595

Мы можем быстро найти среднее значение и стандартное отклонение этого распределения:

#find mean of sample
mean(data)

[1] 10.10662

#find standard deviation of sample
sd(data)

[1] 2.787292

Мы также можем создать быструю гистограмму для визуализации распределения значений данных:

hist(data, col='steelblue')

Мы даже можем выполнить тест Шапиро-Уилка, чтобы увидеть, исходит ли набор данных из нормальной популяции:

shapiro.test(data)

 Shapiro-Wilk normality test

data: data
W = 0.99274, p-value = 0.4272

Значение p теста оказывается равным 0,4272.Поскольку это значение не меньше 0,05, мы можем предположить, что данные выборки получены из населения с нормальным распределением.

Этот результат не должен вызывать удивления, поскольку мы генерировали данные с помощью функции rnorm() , которая естественным образом генерирует случайную выборку данных из нормального распределения.

Дополнительные ресурсы

Как построить нормальное распределение в R
Руководство по dnorm, pnorm, qnorm и rnorm в R
Как выполнить тест Шапиро-Уилка на нормальность в R