Условие 10% в статистике: определение и пример


Испытание Бернулли — это эксперимент с двумя возможными исходами — «успех» или «неудача» — и вероятность успеха одинакова при каждом проведении эксперимента.

Примером испытания Бернулли является подбрасывание монеты. Монета может приземлиться только с двух сторон (мы можем назвать орел «успехом», а решку «неудачей»), а вероятность успеха при каждом броске равна 0,5, если предположить, что монета честная.

Часто в статистике, когда мы хотим рассчитать вероятности, включающие более чем несколько испытаний Бернулли, мы используем нормальное распределение в качестве приближения. Однако для этого мы должны предположить, что испытания независимы.

В тех случаях, когда испытания на самом деле не являются независимыми, мы все же можем предположить, что они независимы, если размер выборки, с которой мы работаем, не превышает 10% размера популяции. Это известно как условие 10% .

Условие 10%: пока размер выборки меньше или равен 10% размера популяции, мы все же можем сделать предположение, что испытания Бернулли независимы.

Интуиция за условием 10%

Чтобы развить интуицию, лежащую в основе «Условия 10%», рассмотрим следующий пример.

Предположим , что истинная доля учащихся определенного класса, предпочитающих футбол баскетболу, составляет 50%. Пусть случайная величина X будет числом студентов, случайно выбранных в 4 испытаниях, которые предпочитают футбол баскетболу. Допустим, нас интересует вероятность того, что все 4 случайно выбранных ученика предпочитают футбол баскетболу.

Если размер нашего класса равен 20, а наши испытания были независимыми (например, мы могли взять повторные выборки всех 20 учеников), то вероятность того, что каждый ученик предпочтет футбол баскетболу, можно рассчитать как:

P(Все 4 ученика предпочитают футбол) = 10/20 * 10/20 * 10/20 * 10/20 = 0,0625 .

Однако, если наши испытания не являются независимыми (например, когда мы выбираем одного ученика, его нельзя вернуть в класс), тогда вероятность того, что все 4 ученика предпочтут футбол, будет рассчитываться как:

P(Все 4 ученика предпочитают футбол) = 10/20 * 9/19 * 8/18 * 7/17 = 0,0433 .

Эти две вероятности совершенно разные. Учтите, что в этом примере размер нашей выборки (4 студента) не меньше или равен 10% населения (20 студентов), поэтому мы не сможем использовать условие 10%.

Однако рассмотрим следующую таблицу, которая показывает вероятность того, что все 4 случайно выбранных ученика предпочтут футбол, в зависимости от размера класса:

По мере того, как размер выборки по отношению к размеру популяции (например, «размер класса» в этом примере) уменьшается, расчетная вероятность между независимыми испытаниями и не независимыми испытаниями становится все ближе и ближе.

Обратите внимание, что когда размер выборки составляет ровно 10% от размера популяции, разница между вероятностями независимых испытаний и ненезависимых испытаний относительно одинакова.

А когда размер выборки намного меньше 10 % от размера популяции (например, всего 0,4 % от численности популяции в последней строке таблицы), вероятности между независимыми и не независимыми испытаниями очень близки.

Вывод

Условие 10% говорит о том, что размер нашей выборки должен быть меньше или равен 10% от размера популяции, чтобы с уверенностью сделать предположение о том, что набор испытаний Бернулли является независимым.

Конечно, лучше всего, если размер нашей выборки будет намного меньше 10% от размера совокупности, чтобы наши выводы о совокупности были максимально точными. Например, мы бы предпочли, чтобы размер нашей выборки составлял всего 5% населения, а не 10%.

Дополнительные ресурсы

Введение в нормальное распределение
Введение в биномиальное распределение
Введение в центральную предельную теорему