Доверительный интервал для разницы в пропорциях

Доверительный интервал для разницы в пропорциях

Доверительный интервал (ДИ) для разницы в пропорциях — это диапазон значений, который, вероятно, содержит истинное различие между двумя пропорциями населения с определенным уровнем достоверности.

В этом руководстве объясняется следующее:

  • Мотивация для создания этого доверительного интервала.
  • Формула для создания этого доверительного интервала.
  • Пример того, как рассчитать этот доверительный интервал.
  • Как интерпретировать этот доверительный интервал.

КИ для разницы в пропорциях: мотивация

Часто исследователей интересует оценка разницы между двумя пропорциями населения. Чтобы оценить эту разницу, они собирают случайную выборку из каждой совокупности и вычисляют пропорцию для каждой выборки. Затем они могут сравнить разницу между двумя пропорциями.

Однако они не могут точно знать, соответствует ли разница в пропорциях выборки истинной разнице в пропорциях населения, поэтому они могут создать доверительный интервал для разницы между двумя пропорциями. Это обеспечивает диапазон значений, который, вероятно, содержит истинную разницу между пропорциями населения.

Например, предположим, что мы хотим оценить разницу в доле жителей, поддерживающих определенный закон в округе А, по сравнению с долей жителей, поддерживающих закон в округе Б.

Поскольку в каждом округе проживают тысячи жителей, было бы слишком долго и дорого обходиться и опрашивать каждого отдельного жителя в каждом округе.

Вместо этого мы могли бы взять простую случайную выборку жителей из каждого округа и использовать пропорцию в пользу закона в каждой выборке, чтобы оценить истинную разницу в пропорциях между двумя округами:

Поскольку наши выборки случайны, разница в пропорциях между двумя выборками не обязательно точно соответствует разнице в пропорциях между двумя совокупностями. Таким образом, чтобы зафиксировать эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, которые, вероятно, содержат истинную разницу в пропорциях между двумя популяциями.

CI для разницы в пропорциях: формула

Мы используем следующую формулу для расчета доверительного интервала для разницы между двумя пропорциями населения:

Доверительный интервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

куда:

  • p 1 , p 2 : доля образца 1, доля образца 2
  • z: z-критическое значение, основанное на доверительном уровне
  • n 1 , n 2 : размер выборки 1, размер выборки 2

Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:

| Уровень достоверности | z-значение | | --- | --- | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |

Обратите внимание, что более высокие уровни достоверности соответствуют большим значениям z, что приводит к более широким доверительным интервалам. Это означает, что, например, 95-процентный доверительный интервал будет шире, чем 90-процентный доверительный интервал для того же набора данных.

CI для разницы в пропорциях: пример

Предположим, мы хотим оценить разницу в доле жителей, поддерживающих определенный закон в округе А, по сравнению с долей жителей, поддерживающих закон в округе Б. Вот сводные данные для каждой выборки:

Образец 1:

  • п 1 = 100
  • p 1 = 0,62 (т.е. 62 из 100 жителей поддерживают закон)

Образец 2:

  • п 2 = 100
  • p 2 = 0,46 (т.е. 46 из 100 жителей поддерживают закон)

Вот как найти различные доверительные интервалы для разницы в пропорциях населения:

90% доверительный интервал:

(0,62-0,46) +/- 1,645*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [0,0456, 0,2744]

95% доверительный интервал:

(0,62-0,46) +/- 1,96*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [0,0236, 0,2964]

99% доверительный интервал:

(0,62-0,46) +/- 2,58*√(0,62(1-0,62)/100 + 0,46(1-0,46)/100) = [-0,0192, 0,3392]

Примечание. Вы также можете найти эти доверительные интервалы, используя Доверительный интервал для калькулятора разницы в пропорциях .

CI для разницы в пропорциях : интерпретация

То, как мы интерпретируем доверительный интервал, выглядит следующим образом:

Существует вероятность 95%, что доверительный интервал [0,0236, 0,2964] содержит истинную разницу в доле жителей, поддерживающих закон, между двумя округами.

Поскольку этот интервал не содержит значения «0», это означает, что весьма вероятно, что существует реальная разница в доле жителей, поддерживающих этот закон, в округе А по сравнению с округом Б.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.