Как рассчитать условную вероятность в Python


Условная вероятность того, что событие А произойдет при условии, что произошло событие В , рассчитывается следующим образом:

Р(А|В) = Р(А∩В) / Р(В)

куда:

P(A∩B) = вероятность того, что событие A и событие B произойдут.

P(B) = вероятность того, что событие B произойдет.

В следующем примере показано, как использовать эту формулу для вычисления условных вероятностей в Python.

Пример: вычисление условной вероятности в Python

Предположим, мы разослали опрос 300 людям, спрашивая их, какой вид спорта им нравится больше всего: бейсбол, баскетбол, футбол или американский футбол.

Мы можем создать следующую таблицу в Python для хранения ответов на опрос:

import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd.DataFrame({'gender ': np.repeat (np.array(['Male', 'Female']), 150),
 'sport ': np.repeat (np.array(['Baseball', 'Basketball', 'Football',
 'Soccer', 'Baseball', 'Basketball',
 'Football', 'Soccer']), 
 (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd.crosstab (index=df['gender'], columns=df['sport'], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender 
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

Связанный : Как использовать pd.crosstab() для создания таблиц непредвиденных обстоятельств в Python

Мы можем использовать следующий синтаксис для извлечения значений из таблицы:

#extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

Мы можем использовать следующий синтаксис для вычисления вероятности того, что человек является мужчиной, учитывая, что он предпочитает бейсбол в качестве любимого вида спорта:

#calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0] / survey_data. iloc [2, 0]

0.5

И мы можем использовать следующий синтаксис, чтобы вычислить вероятность того, что человек предпочитает баскетбол в качестве своего любимого вида спорта, учитывая, что он женщина:

#calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0, 1] / survey_data. iloc [0, 4]

0.3466666666666667

Мы можем использовать этот базовый подход для вычисления любой условной вероятности, которую мы хотим, из таблицы непредвиденных обстоятельств.

Дополнительные ресурсы

Следующие руководства содержат дополнительную информацию о работе с вероятностью:

Закон полной вероятности
Как найти среднее значение распределения вероятностей
Как найти стандартное отклонение распределения вероятностей

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.