Условная вероятность того, что событие А произойдет при условии, что произошло событие В , рассчитывается следующим образом:
Р(А|В) = Р(А∩В) / Р(В)
куда:
P(A∩B) = вероятность того, что событие A и событие B произойдут.
P(B) = вероятность того, что событие B произойдет.
В следующем примере показано, как использовать эту формулу для вычисления условных вероятностей в Python.
Пример: вычисление условной вероятности в Python
Предположим, мы разослали опрос 300 людям, спрашивая их, какой вид спорта им нравится больше всего: бейсбол, баскетбол, футбол или американский футбол.
Мы можем создать следующую таблицу в Python для хранения ответов на опрос:
import pandas as pd
import numpy as np
#create pandas DataFrame with raw data
df = pd.DataFrame({'gender ': np.repeat (np.array(['Male', 'Female']), 150),
'sport ': np.repeat (np.array(['Baseball', 'Basketball', 'Football',
'Soccer', 'Baseball', 'Basketball',
'Football', 'Soccer']),
(34, 40, 58, 18, 34, 52, 20, 44))})
#produce contingency table to summarize raw data
survey_data = pd.crosstab (index=df['gender'], columns=df['sport'], margins= True )
#view contingency table
survey_data
sport Baseball Basketball Football Soccer All
gender
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300
Связанный : Как использовать pd.crosstab() для создания таблиц непредвиденных обстоятельств в Python
Мы можем использовать следующий синтаксис для извлечения значений из таблицы:
#extract value in second row and first column
survey_data. iloc [1, 0]
[1] 34
Мы можем использовать следующий синтаксис для вычисления вероятности того, что человек является мужчиной, учитывая, что он предпочитает бейсбол в качестве любимого вида спорта:
#calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0] / survey_data. iloc [2, 0]
0.5
И мы можем использовать следующий синтаксис, чтобы вычислить вероятность того, что человек предпочитает баскетбол в качестве своего любимого вида спорта, учитывая, что он женщина:
#calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0, 1] / survey_data. iloc [0, 4]
0.3466666666666667
Мы можем использовать этот базовый подход для вычисления любой условной вероятности, которую мы хотим, из таблицы непредвиденных обстоятельств.
Дополнительные ресурсы
Следующие руководства содержат дополнительную информацию о работе с вероятностью:
Закон полной вероятности
Как найти среднее значение распределения вероятностей
Как найти стандартное отклонение распределения вероятностей