Испытание Бернулли — это эксперимент с двумя возможными исходами — «успех» или «неудача» — и вероятность успеха одинакова при каждом проведении эксперимента.
Примером испытания Бернулли является подбрасывание монеты. Монета может приземлиться только с двух сторон (мы можем назвать орел «успехом», а решку «неудачей»), а вероятность успеха при каждом броске равна 0,5, если предположить, что монета честная.
Часто в статистике, когда мы хотим рассчитать вероятности, включающие более чем несколько испытаний Бернулли, мы используем нормальное распределение в качестве приближения. Однако для этого мы должны проверить, что выполняется условие успеха/неудачи :
Условие успеха/неудачи: в выборке должно быть не менее 10 ожидаемых успехов и 10 ожидаемых неудач, чтобы использовать нормальное распределение в качестве приближения.
Записав с использованием обозначений, мы должны проверить оба следующих утверждения:
- Ожидаемое количество успехов не менее 10: np ≥ 10
- Ожидаемое количество отказов не менее 10: n(1-p) ≥ 10
где n — размер выборки, а p — вероятность успеха в данном испытании.
Примечание. Вместо этого в некоторых учебниках говорится, что для использования нормального приближения необходимо только 5 ожидаемых успехов и 5 ожидаемых неудач. Однако чаще используется 10, и это более консервативное число, поэтому мы будем использовать это число в этом уроке.
Пример: проверка условия успеха/неудачи
Предположим, мы хотим создать доверительный интервал для доли жителей округа, поддерживающих определенный закон. Мы выбираем случайную выборку из 100 жителей и спрашиваем их об их отношении к закону. Вот результаты:
- Размер выборки n = 100
- Доля в пользу закона p = 0,56
Мы хотели бы использовать следующую формулу для расчета доверительного интервала:
Доверительный интервал = p +/- z * √ p (1-p) / n
куда:
- p: доля выборки
- z: значение z, соответствующее нормальному распределению
- n: размер выборки
В этой формуле используется значение z, полученное из нормального распределения. Таким образом, в этой формуле мы используем нормальное распределение для аппроксимации биномиального распределения.
Однако для этого нам нужно проверить, что условие успеха/неудачи выполнено. Давайте проверим, что и количество успехов, и количество неудач в выборке не меньше 10:
Количество успехов: np = 100*0,56 = 56
Количество отказов: n(1-p) = 100*(1-0,56) = 44
Оба числа равны или больше 10, поэтому мы можем использовать приведенную выше формулу для расчета доверительного интервала.
Дополнительные ресурсы
Еще одно условие, которое необходимо выполнить, чтобы использовать нормальное распределение в качестве аппроксимации биномиального распределения, заключается в том, что размер выборки, с которой мы работаем, не превышает 10% размера совокупности. Это известно какусловие 10% .
Также имейте в виду, что если вы работаете с двумя пропорциями (например , создаете доверительный интервал для разницы между пропорциями ), вы должны убедиться, что ожидаемое количество успешных и неудачных попыток в обеих выборках равно как минимум 10.