Условие 10% в статистике: определение и пример

Условие 10% в статистике: определение и пример

Испытание Бернулли — это эксперимент с двумя возможными исходами — «успех» или «неудача» — и вероятность успеха одинакова при каждом проведении эксперимента.

Примером испытания Бернулли является подбрасывание монеты. Монета может приземлиться только с двух сторон (мы можем назвать орел «успехом», а решку «неудачей»), а вероятность успеха при каждом броске равна 0,5, если предположить, что монета честная.

Часто в статистике, когда мы хотим рассчитать вероятности, включающие более чем несколько испытаний Бернулли, мы используем нормальное распределение в качестве приближения. Однако для этого мы должны предположить, что испытания независимы.

В тех случаях, когда испытания на самом деле не являются независимыми, мы все же можем предположить, что они независимы, если размер выборки, с которой мы работаем, не превышает 10% размера популяции. Это известно как условие 10% .

Условие 10%: пока размер выборки меньше или равен 10% размера популяции, мы все же можем сделать предположение, что испытания Бернулли независимы.

Интуиция за условием 10%

Чтобы развить интуицию, лежащую в основе «Условия 10%», рассмотрим следующий пример.

Предположим , что истинная доля учащихся определенного класса, предпочитающих футбол баскетболу, составляет 50%. Пусть случайная величина X будет числом студентов, случайно выбранных в 4 испытаниях, которые предпочитают футбол баскетболу. Допустим, нас интересует вероятность того, что все 4 случайно выбранных ученика предпочитают футбол баскетболу.

Если размер нашего класса равен 20, а наши испытания были независимыми (например, мы могли взять повторные выборки всех 20 учеников), то вероятность того, что каждый ученик предпочтет футбол баскетболу, можно рассчитать как:

P(Все 4 ученика предпочитают футбол) = 10/20 * 10/20 * 10/20 * 10/20 = 0,0625 .

Однако, если наши испытания не являются независимыми (например, когда мы выбираем одного ученика, его нельзя вернуть в класс), тогда вероятность того, что все 4 ученика предпочтут футбол, будет рассчитываться как:

P(Все 4 ученика предпочитают футбол) = 10/20 * 9/19 * 8/18 * 7/17 = 0,0433 .

Эти две вероятности совершенно разные. Учтите, что в этом примере размер нашей выборки (4 студента) не меньше или равен 10% населения (20 студентов), поэтому мы не сможем использовать условие 10%.

Однако рассмотрим следующую таблицу, которая показывает вероятность того, что все 4 случайно выбранных ученика предпочтут футбол, в зависимости от размера класса:

10-процентное состояние в статистике

По мере того, как размер выборки по отношению к размеру популяции (например, «размер класса» в этом примере) уменьшается, расчетная вероятность между независимыми испытаниями и не независимыми испытаниями становится все ближе и ближе.

Обратите внимание, что когда размер выборки составляет ровно 10% от размера популяции, разница между вероятностями независимых испытаний и ненезависимых испытаний относительно одинакова.

А когда размер выборки намного меньше 10 % от размера популяции (например, всего 0,4 % от численности популяции в последней строке таблицы), вероятности между независимыми и не независимыми испытаниями очень близки.

Вывод

Условие 10% говорит о том, что размер нашей выборки должен быть меньше или равен 10% от размера популяции, чтобы с уверенностью сделать предположение о том, что набор испытаний Бернулли является независимым.

Конечно, лучше всего, если размер нашей выборки будет намного меньше 10% от размера совокупности, чтобы наши выводы о совокупности были максимально точными. Например, мы бы предпочли, чтобы размер нашей выборки составлял всего 5% населения, а не 10%.

Дополнительные ресурсы

Введение в нормальное распределение
Введение в биномиальное распределение
Введение в центральную предельную теорему

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.