Доверительный интервал для биномиальной вероятности рассчитывается по следующей формуле:
Доверительный интервал = p +/- z * (√ p (1-p) / n )
куда:
- p: доля «успехов»
- z: выбранное значение z
- n: размер выборки
Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:
| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |
Например, предположим, что мы хотим оценить долю жителей округа, поддерживающих определенный закон. Мы выбираем случайную выборку из 100 жителей и обнаруживаем, что 56 из них поддерживают закон.
В этом руководстве объясняются три разных способа расчета доверительного интервала для истинной доли жителей всего округа, поддерживающих закон.
Способ 1: используйте функцию prop.test()
Один из способов рассчитать биномиальный доверительный интервал 95% — использовать функцию prop.test() в базе R:
#calculate 95% confidence interval
prop. test (x=56, n=100, conf. level =.95, correct= FALSE )
1-sample proportions test without continuity correction
data: 56 out of 100, null probability 0.5
X-squared = 1.44, df = 1, p-value = 0.2301
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4622810 0.6532797
sample estimates:
p
0.56
95% ДИ для истинной доли жителей округа, поддерживающих закон, составляет [0,46228, 0,65328] .
Способ 2: используйте функцию binconf()
Другой способ расчета доверительного интервала — использовать функцию binconf() из пакета Hmisc :
library (Hmisc)
#calculate 95% confidence interval
binconf(x=56, n=100, alpha=.05)
PointEst Lower Upper
0.56 0.462281 0.6532797
Обратите внимание, что этот доверительный интервал совпадает с рассчитанным в предыдущем примере.
Способ 3: расчет доверительного интервала вручную
Другой способ рассчитать биномиальный доверительный интервал 95% в R — сделать это вручную:
#define proportion
p <- 56/100
#define significance level
a <- .05
#calculate 95% confidence interval
p + c(- qnorm (1-a/2), qnorm (1-a/2))\* sqrt ((1/100)\*p\*(1-p))
[1] 0.4627099 0.6572901
Узнайте больше о функции qnorm() здесь: Руководство по dnorm, pnorm, qnorm и rnorm в R
Дополнительные ресурсы
Как выполнить биномиальный тест в R
Как построить биномиальное распределение в R