Апостериорная вероятность: определение + пример

Апостериорная вероятность — это обновленная вероятность некоторого события, происходящего после учета новой информации.

Например, нас может заинтересовать определение вероятности того, что какое-то событие «А» произойдет после того, как мы учтем какое-то событие «В», которое только что произошло. Мы могли бы рассчитать эту апостериорную вероятность, используя следующую формулу:

Р(А|В) = Р(А) * Р(В|А) / Р(В)

куда:

P(A|B) = вероятность события A при условии, что событие B произошло. Обратите внимание, что «|» означает «дано».

P(A) = вероятность того, что событие A произойдет.

P(B) = вероятность того, что событие B произойдет.

P(B|A) = вероятность наступления события B при условии, что событие A произошло.

Пример: расчет апостериорной вероятности

Лес состоит из 20% дубов и 80% кленов. Предположим, известно, что 90 % дубов здоровы, а здоровы лишь 50 % клёнов. Предположим, что на расстоянии можно сказать, что конкретное дерево здорово. Какова вероятность того, что это дуб?

Напомним, что вероятность наступления события А при условии, что произошло событие В, равна:

Р(А|В) = Р(А) * Р(В|А) / Р(В)

В этом примере вероятность того, что дерево является дубом, при условии, что дерево здоровое, составляет:

P(Дуб|Здоровый) = P(Дуб) * P(Здоровый|Дуб) / P(Здоровый)

P(Дуб) = Вероятность того, что данное дерево является дубом, равна 0,2 , потому что 20% всех деревьев в лесу являются дубами.

P(Healthy) = Вероятность того, что данное дерево является здоровым, можно рассчитать как (0,20)*(0,9) + (0,8)*(0,5) = 0,58 .

P(Здоровый|Дуб) = Вероятность того, что дерево здоровое, учитывая, что это дуб, равна 0,9 , поскольку нам сказали, что 90% дубов здоровы.

Используя эти три числа, мы можем найти вероятность того, что дерево является дубом при условии, что оно здоровое:

P(Дуб|Здоровый) = P(Дуб) * P(Здоровый|Дуб) / P(Здоровый) = (0,2) * (0,9) / (0,58) = 0,3103 .

Для интуитивного понимания этой вероятности предположим, что следующая сетка представляет этот лес со 100 деревьями. Ровно 20 деревьев дубы и 18 из них здоровые. Остальные 80 деревьев — это клены, и 40 из них — здоровые.

(O = дуб, M = клен, зеленый = здоровый, красный = нездоровый)

Из всех деревьев ровно 58 здоровых и 18 из этих здоровых дубов. Таким образом, если мы знаем, что выбрали здоровое дерево, то вероятность того, что это дуб, составляет 18/58 = 0,3103 .

Когда следует использовать апостериорную вероятность?

Апостериорная вероятность используется в самых разных областях, включая финансы, медицину, экономику и прогнозирование погоды.

Весь смысл использования апостериорных вероятностей состоит в том, чтобы обновить предыдущее убеждение, которое у нас было о чем-то, как только мы получим новую информацию.

Напомним, что в предыдущем примере мы знали, что вероятность того, что данное дерево в лесу является дубом, составляет 20 %. Это известно как априорная вероятность.Если бы мы просто выбрали дерево наугад, то знали бы, что вероятность того, что это дуб, равна 0,20.

Однако, как только мы получили новую информацию о том, что выбранное нами дерево было здоровым, мы смогли использовать эту новую информацию, чтобы определить, что апостериорная вероятность того, что это дерево является дубом, вместо этого равнялась 0,3103.

В реальном мире люди постоянно сталкиваются с новой информацией. Эта новая информация помогает нам обновить наши прежние убеждения. С точки зрения статистики это означает, что мы можем генерировать апостериорные вероятности происходящих событий, что помогает нам получить более точное представление о мире и позволяет делать более точные прогнозы будущих событий.