Если X является случайной величиной , которая следует биномиальному распределению с n испытаниями и p вероятностью успеха в данном испытании, то мы можем вычислить среднее значение (μ) и стандартное отклонение (σ) X , используя следующие формулы:
- м = нп
- σ = √ np (1-p)
Оказывается, если n достаточно велико, мы можем использовать нормальное распределение для аппроксимации вероятностей, связанных с биномиальным распределением. Это известно как нормальное приближение к биному .
Чтобы n было «достаточно большим», оно должно соответствовать следующим критериям:
- np ≥ 5
- п (1-р) ≥ 5
Когда оба критерия соблюдены, мы можем использовать нормальное распределение, чтобы ответить на вопросы вероятности, связанные с биномиальным распределением.
Однако нормальное распределение является непрерывным распределением вероятностей, тогда как биномиальное распределение является дискретным распределением вероятностей, поэтому мы должны применять поправку на непрерывность при расчете вероятностей.
Проще говоря, поправка на непрерывность — это название, данное прибавлению или вычитанию 0,5 к дискретному значению x.
Например, предположим, что мы хотим найти вероятность того, что монета выпадет орлом меньше или равно 45 раз за 100 бросков. То есть мы хотим найти P(X ≤ 45). Чтобы использовать нормальное распределение для аппроксимации биномиального распределения, вместо этого мы должны найти P (X ≤ 45,5).
В следующей таблице показано, когда следует прибавлять или вычитать 0,5 в зависимости от типа вероятности, которую вы пытаетесь найти:
| Использование биномиального распределения | Использование нормального распределения с коррекцией непрерывности | | --- | --- | | Х = 45 | 44,5 < Х < 45,5 | | Х ≤ 45 | Х < 45,5 | | Х < 45 | Х < 44,5 | | Х ≥ 45 | Х > 44,5 | | Х > 45 | Х > 45,5 |
В следующем пошаговом примере показано, как использовать нормальное распределение для аппроксимации биномиального распределения.
Пример: нормальное приближение к биномиальному
Предположим, мы хотим узнать вероятность того, что монета выпадет орлом меньше или равно 43 раз за 100 бросков.
В данной ситуации имеем следующие значения:
- n (количество испытаний) = 100
- Х (количество успехов) = 43
- p (вероятность успеха в данном испытании) = 0,50
Чтобы рассчитать вероятность того, что монета выпадет орлом меньше или равно 43 раз, мы можем использовать следующие шаги:
Шаг 1: Убедитесь, что размер выборки достаточно велик для использования нормального приближения.
Во-первых, мы должны убедиться, что выполняются следующие критерии:
- np ≥ 5
- п (1-р) ≥ 5
В этом случае имеем:
- np = 100*0,5 = 50
- n(1-p) = 100*(1 – 0,5) = 100*0,5 = 50
Оба числа больше 5, поэтому мы можем безопасно использовать нормальное приближение.
Шаг 2: Определите поправку на непрерывность, которую необходимо применить.
Ссылаясь на таблицу выше, мы видим, что мы должны добавить 0,5, когда мы работаем с вероятностью в виде X ≤ 43. Таким образом, мы найдем P (X < 43,5).
Шаг 3: Найдите среднее значение (μ) и стандартное отклонение (σ) биномиального распределения.
μ = n*p = 100*0,5 = 50
σ = √ n*p*(1-p) = √ 100*.5*(1-.5) = √ 25 = 5
Шаг 4: Найдите z-показатель, используя среднее значение и стандартное отклонение, найденные на предыдущем шаге.
z = (x – μ) / σ = (43,5 – 50) / 5 = -6,5 / 5 = -1,3.
Шаг 5: Найдите вероятность, связанную с z-оценкой.
Мы можем использовать калькулятор нормального CDF , чтобы найти, что площадь под стандартной кривой нормали слева от -1,3 равна 0,0968 .
Таким образом, вероятность того, что монета выпадет орлом меньше или равно 43 раз за 100 бросков, равна 0,0968 .
Этот пример иллюстрирует следующее:
- У нас была ситуация, когда случайная величина подчинялась биномиальному распределению.
- Мы хотели найти вероятность получения определенного значения для этой случайной величины.
- Поскольку размер выборки (n = 100 испытаний) был достаточно большим, мы смогли использовать нормальное распределение для аппроксимации биномиального распределения.
Это полный пример того, как использовать нормальное приближение для нахождения вероятностей, связанных с биномиальным распределением.