Простое объяснение коррекции непрерывности в статистике


Поправка на непрерывность применяется, когда вы хотите использовать непрерывное распределение для аппроксимации дискретного распределения. Обычно он используется, когда вы хотите использовать нормальное распределение для аппроксимации биномиального распределения .

Напомним, что биномиальное распределение говорит нам о вероятности достижения x успехов в n испытаниях при условии, что вероятность успеха в одном испытании равна p.Чтобы ответить на вопросы о вероятности с помощью биномиального распределения, мы могли бы просто использовать калькулятор биномиального распределения , но мы также могли бы аппроксимировать вероятность, используя нормальное распределение с поправкой на непрерывность.

Коррекция непрерывности — это название, данное прибавлению или вычитанию 0,5 к дискретному значению x .

Например, предположим, что мы хотим найти вероятность того, что монета выпадет орлом меньше или равно 45 раз за 100 бросков. То есть мы хотим найти P(X ≤ 45). Чтобы использовать нормальное распределение для аппроксимации биномиального распределения, вместо этого мы должны найти P (X ≤ 45,5).

В следующей таблице показано, когда следует прибавлять или вычитать 0,5 в зависимости от типа вероятности, которую вы пытаетесь найти:

| Использование биномиального распределения | Использование нормального распределения с коррекцией непрерывности | | --- | --- | | Х = 45 | 44,5 < Х < 45,5 | | Х ≤ 45 | Х < 45,5 | | Х < 45 | Х < 44,5 | | Х ≥ 45 | Х > 44,5 | | Х > 45 | Х > 45,5 |

Примечание:
Применять поправку на непрерывность к нормальному распределению уместно только для аппроксимации биномиального распределения, когда n*p и n*(1-p) оба равны не менее 5.
Например, предположим, что n = 15 и p = 0,6. В таком случае:
п*р = 15 * 0,6 = 9
n*(1-p) = 15 * (1 – 0,6) = 15 * (0,4) = 6
Поскольку оба эти числа больше или равны 5, в этом сценарии можно применить поправку на непрерывность.

В следующем примере показано, как применить поправку на непрерывность к нормальному распределению для аппроксимации биномиального распределения.

Пример применения поправки на непрерывность

Предположим, мы хотим узнать вероятность того, что монета выпадет орлом меньше или равно 43 раз за 100 бросков. В таком случае:

n = количество испытаний = 100

Х = количество успехов = 43

p = вероятность успеха в данном испытании = 0,50

Мы можем ввести эти числа в калькулятор биномиального распределения , чтобы увидеть, что вероятность того, что монета выпадет орлом меньше или равна 43 раза, составляет 0,09667 .

Чтобы аппроксимировать биномиальное распределение, применяя поправку на непрерывность к нормальному распределению, мы можем использовать следующие шаги:

Шаг 1: Убедитесь, что n*p и n*(1-p) оба не меньше 5 .

п*р = 100*0,5 = 50

n*(1-p) = 100*(1 – 0,5) = 100*0,5 = 50

Оба числа больше или равны 5, так что можно продолжать.

Шаг 2: Определите, следует ли вам добавить или вычесть 0,5

Ссылаясь на таблицу выше, мы видим, что мы должны добавить 0,5 , когда мы работаем с вероятностью в виде X ≤ 43. Таким образом, мы найдем P (X < 43,5).

Шаг 3: Найдите среднее значение (μ) и стандартное отклонение (σ) биномиального распределения.

μ = n*p = 100*0,5 = 50

σ = √ n*p*(1-p) = √ 100*.5*(1-.5) = √ 25 = 5

Шаг 4: Найдите z-показатель, используя среднее значение и стандартное отклонение, найденные на предыдущем шаге.

z = (x – μ) / σ = (43,5 – 50) / 5 = -6,5 / 5 = -1,3.

Шаг 5: Используйте таблицу Z, чтобы найти вероятность, связанную с z-показателем.

Согласно таблице Z вероятность, связанная с z = -1,3, составляет 0,0968 .

Таким образом, точная вероятность, которую мы нашли, используя биномиальное распределение, составила 0,09667 , в то время как приблизительная вероятность, которую мы нашли, используя поправку на непрерывность с нормальным распределением, составила 0,0968.Эти два значения довольно близки.

Когда использовать коррекцию непрерывности

До того, как появилось современное статистическое программное обеспечение, и вычисления должны были выполняться вручную, поправки на непрерывность часто использовались для нахождения вероятностей, связанных с дискретными распределениями. Сегодня поправки на непрерывность играют меньшую роль в вычислении вероятностей, поскольку мы обычно можем полагаться на программное обеспечение или калькуляторы для расчета вероятностей за нас.

Вместо этого это просто тема, обсуждаемая на занятиях по статистике, чтобы проиллюстрировать взаимосвязь между биномиальным распределением и нормальным распределением и показать, что нормальное распределение может аппроксимировать биномиальное распределение, применяя поправку на непрерывность.

Калькулятор коррекции непрерывности

Используйте Калькулятор поправки на непрерывность , чтобы автоматически применить поправку на непрерывность к нормальному распределению для аппроксимации биномиальных вероятностей.