Что такое условие успеха/неудачи в статистике?

Испытание Бернулли — это эксперимент с двумя возможными исходами — «успех» или «неудача» — и вероятность успеха одинакова при каждом проведении эксперимента.

Примером испытания Бернулли является подбрасывание монеты. Монета может приземлиться только с двух сторон (мы можем назвать орел «успехом», а решку «неудачей»), а вероятность успеха при каждом броске равна 0,5, если предположить, что монета честная.

Часто в статистике, когда мы хотим рассчитать вероятности, включающие более чем несколько испытаний Бернулли, мы используем нормальное распределение в качестве приближения. Однако для этого мы должны проверить, что выполняется условие успеха/неудачи :

Условие успеха/неудачи: в выборке должно быть не менее 10 ожидаемых успехов и 10 ожидаемых неудач, чтобы использовать нормальное распределение в качестве приближения.

Записав с использованием обозначений, мы должны проверить оба следующих утверждения:

Ожидаемое количество успехов не менее 10: np ≥ 10
Ожидаемое количество отказов не менее 10: n(1-p) ≥ 10

где n — размер выборки, а p — вероятность успеха в данном испытании.

Примечание. Вместо этого в некоторых учебниках говорится, что для использования нормального приближения необходимо только 5 ожидаемых успехов и 5 ожидаемых неудач. Однако чаще используется 10, и это более консервативное число, поэтому мы будем использовать это число в этом уроке.

Пример: проверка условия успеха/неудачи

Предположим, мы хотим создать доверительный интервал для доли жителей округа, поддерживающих определенный закон. Мы выбираем случайную выборку из 100 жителей и спрашиваем их об их отношении к закону. Вот результаты:

Размер выборки n = 100
Доля в пользу закона p = 0,56

Мы хотели бы использовать следующую формулу для расчета доверительного интервала:

Доверительный интервал = p +/- z * √ p (1-p) / n

куда:

p: доля выборки
z: значение z, соответствующее нормальному распределению
n: размер выборки

В этой формуле используется значение z, полученное из нормального распределения. Таким образом, в этой формуле мы используем нормальное распределение для аппроксимации биномиального распределения.

Однако для этого нам нужно проверить, что условие успеха/неудачи выполнено. Давайте проверим, что и количество успехов, и количество неудач в выборке не меньше 10:

Количество успехов: np = 100*0,56 = 56

Количество отказов: n(1-p) = 100*(1-0,56) = 44

Оба числа равны или больше 10, поэтому мы можем использовать приведенную выше формулу для расчета доверительного интервала.

Дополнительные ресурсы

Еще одно условие, которое необходимо выполнить, чтобы использовать нормальное распределение в качестве аппроксимации биномиального распределения, заключается в том, что размер выборки, с которой мы работаем, не превышает 10% размера совокупности. Это известно какусловие 10% .

Также имейте в виду, что если вы работаете с двумя пропорциями (например , создаете доверительный интервал для разницы между пропорциями ), вы должны убедиться, что ожидаемое количество успешных и неудачных попыток в обеих выборках равно как минимум 10.

Что такое условие успеха/неудачи в статистике?

Пример: проверка условия успеха/неудачи

Дополнительные ресурсы

Редакция Кодкампа