Что такое условие успеха/неудачи в статистике?


Испытание Бернулли — это эксперимент с двумя возможными исходами — «успех» или «неудача» — и вероятность успеха одинакова при каждом проведении эксперимента.

Примером испытания Бернулли является подбрасывание монеты. Монета может приземлиться только с двух сторон (мы можем назвать орел «успехом», а решку «неудачей»), а вероятность успеха при каждом броске равна 0,5, если предположить, что монета честная.

Часто в статистике, когда мы хотим рассчитать вероятности, включающие более чем несколько испытаний Бернулли, мы используем нормальное распределение в качестве приближения. Однако для этого мы должны проверить, что выполняется условие успеха/неудачи :

Условие успеха/неудачи: в выборке должно быть не менее 10 ожидаемых успехов и 10 ожидаемых неудач, чтобы использовать нормальное распределение в качестве приближения.

Записав с использованием обозначений, мы должны проверить оба следующих утверждения:

  • Ожидаемое количество успехов не менее 10: np ≥ 10
  • Ожидаемое количество отказов не менее 10: n(1-p) ≥ 10

где n — размер выборки, а p — вероятность успеха в данном испытании.

Примечание. Вместо этого в некоторых учебниках говорится, что для использования нормального приближения необходимо только 5 ожидаемых успехов и 5 ожидаемых неудач. Однако чаще используется 10, и это более консервативное число, поэтому мы будем использовать это число в этом уроке.

Пример: проверка условия успеха/неудачи

Предположим, мы хотим создать доверительный интервал для доли жителей округа, поддерживающих определенный закон. Мы выбираем случайную выборку из 100 жителей и спрашиваем их об их отношении к закону. Вот результаты:

  • Размер выборки n = 100
  • Доля в пользу закона p = 0,56

Мы хотели бы использовать следующую формулу для расчета доверительного интервала:

Доверительный интервал = p +/- z * √ p (1-p) / n

куда:

  • p: доля выборки
  • z: значение z, соответствующее нормальному распределению
  • n: размер выборки

В этой формуле используется значение z, полученное из нормального распределения. Таким образом, в этой формуле мы используем нормальное распределение для аппроксимации биномиального распределения.

Однако для этого нам нужно проверить, что условие успеха/неудачи выполнено. Давайте проверим, что и количество успехов, и количество неудач в выборке не меньше 10:

Количество успехов: np = 100*0,56 = 56

Количество отказов: n(1-p) = 100*(1-0,56) = 44

Оба числа равны или больше 10, поэтому мы можем использовать приведенную выше формулу для расчета доверительного интервала.

Дополнительные ресурсы

Еще одно условие, которое необходимо выполнить, чтобы использовать нормальное распределение в качестве аппроксимации биномиального распределения, заключается в том, что размер выборки, с которой мы работаем, не превышает 10% размера совокупности. Это известно какусловие 10% .

Также имейте в виду, что если вы работаете с двумя пропорциями (например , создаете доверительный интервал для разницы между пропорциями ), вы должны убедиться, что ожидаемое количество успешных и неудачных попыток в обеих выборках равно как минимум 10.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.