Введение в распределение Пуассона


Распределение Пуассона — одно из самых популярных распределений в статистике.

Чтобы понять распределение Пуассона, сначала нужно понять эксперименты Пуассона.

Пуассоновые эксперименты

Эксперимент Пуассона — это эксперимент, обладающий следующими свойствами:

  • Количество успехов в эксперименте можно подсчитать.
  • Известно среднее количество успехов, которое происходит в течение определенного интервала времени (или пространства).
  • Каждый результат является независимым.
  • Вероятность того, что произойдет успех, пропорциональна размеру интервала.

Одним из примеров эксперимента Пуассона является количество рождений в час в данной больнице. Например, предположим, что в конкретной больнице происходит в среднем 10 родов в час. Это эксперимент Пуассона, поскольку он обладает следующими четырьмя свойствами:

  • Количество успехов в эксперименте можно подсчитать – Мы можем подсчитать количество рождений.
  • Известно среднее количество успехов, которое происходит в течение определенного интервала времени. Известно, что в среднем происходит 10 рождений в час.
  • Каждый результат независим — вероятность того, что одна мать родит в течение данного часа, не зависит от вероятности того, что другая мать родит.
  • Вероятность того, что произойдет успех, пропорциональна размеру интервала: чем длиннее интервал времени, тем выше вероятность того, что произойдет рождение.

Мы можем использовать распределение Пуассона, чтобы ответить на вопросы о вероятностях этого эксперимента Пуассона, такие как:

  • Какова вероятность того, что в данный час произойдет более 12 родов?
  • Какова вероятность того, что в данный час произойдет менее 5 родов?
  • Какова вероятность того, что в данный час произойдет от 8 до 11 родов?

Распределение Пуассона

Распределение Пуассона описывает вероятность получения k успехов за заданный интервал времени.

Если случайная величина X подчиняется распределению Пуассона, то вероятность того, что X = k успехов, можно найти по следующей формуле:

P(X=k) = λk * e – λ / k !

куда:

  • λ: среднее количество успехов за определенный интервал
  • k: количество успехов
  • e: константа, равная приблизительно 2,71828.

Например, предположим, что в конкретной больнице в среднем рождается 2 человека в час. Мы можем использовать приведенную выше формулу, чтобы определить вероятность рождения 0, 1, 2, 3 и т. д. в данный час:

P(X=0) = 2 0 * e – 2 / 0! = 0,1353

P(X=1) = 2 1 * e – 2 / 1! = 0,2707

P(X=2) = 2 2 * e – 2 / 2! = 0,2707

P(X=3) = 2 3 * e – 2 / 3! = 0,1805

Мы можем рассчитать вероятность для любого числа рождений вплоть до бесконечности. Мы создаем, а затем создаем простую гистограмму для визуализации этого распределения вероятностей:

Вычисление кумулятивных вероятностей Пуассона

Несложно рассчитать одну вероятность Пуассона (например, вероятность того, что в больнице произойдет 3 рождения в течение заданного часа), используя приведенную выше формулу, но для расчета кумулятивной вероятности Пуассона нам нужно добавить индивидуальные вероятности.

Например, предположим, что мы хотим узнать вероятность того, что в больнице будет 1 или меньше родов в данный час. Мы будем использовать следующую формулу для расчета этой вероятности:

P(X≤1) = P(X=0) + P(X=1) = 0,1353 + 0,2707 = 0,406

Это известно как кумулятивная вероятность , потому что она включает в себя добавление более одной вероятности. Мы можем рассчитать кумулятивную вероятность появления k или меньше рождений в данный час, используя аналогичную формулу:

Р(Х≤0) = Р(Х=0) = 0,1353

P(X≤1) = P(X=0) + P(X=1) = 0,1353 + 0,2707 = 0,406

P(X≤2) = P(X=0) + P(X=1) + P(X=2) = 0,1353 + 0,2707 + 0,2707 = 0,6767

Мы можем рассчитать эти кумулятивные вероятности для любого числа рождений вплоть до бесконечности. Затем мы можем создать гистограмму для визуализации этого кумулятивного распределения вероятностей:

Свойства распределения Пуассона

Распределение Пуассона обладает следующими свойствами:

Среднее значение распределения равно λ .

Дисперсия распределения также равна λ .

Стандартное отклонение распределения равно √ λ .

Например, предположим, что в больнице в среднем рождается 2 ребенка в час.

Среднее число рождений, которое мы ожидаем в данный час, составляет λ = 2 рождения.

Ожидаемая дисперсия числа рождений составляет λ = 2 рождения.

Проблемы практики распределения Пуассона

Используйте следующие практические задачи, чтобы проверить свои знания о распределении Пуассона.

Примечание. Мы будем использоватькалькулятор распределения Пуассона для расчета ответов на эти вопросы.

Проблема 1

Вопрос: Известно, что некий сайт делает 10 продаж в час. Какова вероятность того, что за данный час сайт совершит ровно 8 продаж?

Ответ: Используя калькулятор распределения Пуассона с λ = 10 и x = 8, мы находим, что P(X=8) = 0,1126 .

Проблема 2

Вопрос: Известно, что некий риелтор делает в среднем 5 продаж в месяц. Какова вероятность того, что в данном месяце она совершит более 7 продаж?

Ответ: Используя калькулятор распределения Пуассона с λ = 5 и x = 7, мы находим, что P(X>7) = 0,13337 .

Проблема 3

Вопрос: Известно, что в одной больнице рождается 4 человека в час. Какова вероятность того, что в данный час произойдет 4 или менее родов?

Ответ: Используя калькулятор распределения Пуассона с λ = 4 и x = 4, мы находим, что P(X≤4) = 0,62884 .

Дополнительные ресурсы

В следующих статьях объясняется, как работать с распределением Пуассона в различных статистических программах:

Как использовать распределение Пуассона в R
Как использовать распределение Пуассона в Excel
Как рассчитать вероятности Пуассона на калькуляторе TI-84
Реальные примеры распределения Пуассона
Калькулятор распределения Пуассона