Как рассчитать оценки точек в R (с примерами)


Точечная оценка представляет собой число, которое мы вычисляем на основе выборочных данных для оценки некоторого параметра совокупности. Это служит нашей наилучшей возможной оценкой того, каким может быть истинный параметр населения.

В следующей таблице показана точечная оценка, которую мы используем для оценки параметров совокупности:

| Измерение | Параметр населения | Балльная оценка | | --- | --- | --- | | Иметь в виду | μ (среднее значение населения) | х (выборочное среднее) | | Доля | π (доля населения) | p (пропорция выборки) |

В следующих примерах объясняется, как рассчитать точечные оценки для среднего значения совокупности и доли совокупности в R.

Пример 1: Точечная оценка среднего значения совокупности

Предположим, мы хотим оценить среднюю высоту (в дюймах) определенного типа растений на определенном поле. Мы собираем простую случайную выборку из 13 растений и измеряем высоту каждого растения.

Следующий код показывает, как вычислить выборочное среднее:

#define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

Среднее значение выборки составляет 15,6 дюйма. Это представляет нашу точечную оценку среднего значения населения.

Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения генеральной совокупности:

#find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)\*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

95% доверительный интервал для среднего значения генеральной совокупности составляет [12,0, 19,2] дюймов.

Пример 2: Точечная оценка доли населения

Предположим, мы хотим оценить долю людей в определенном городе, поддерживающих определенный закон. Мы опрашиваем простую случайную выборку из 20 граждан.

В следующем коде показано, как рассчитать долю выборки:

#define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == 'Y') 

#find sample proportion
p <- k/n

p

[1] 0.6

Выборочная доля граждан, поддерживающих закон, составляет 0,6.Это представляет собой нашу точечную оценку доли населения.

Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения генеральной совокупности:

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == 'Y') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)\*sqrt(p\*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

95% доверительный интервал для доли населения составляет [0,39, 0,81] .

Дополнительные ресурсы

Как рассчитать сводку из пяти чисел в R
Как найти доверительные интервалы в R
Как построить доверительный интервал в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.