Что такое условное распределение в статистике?

Что такое условное распределение в статистике?

Если X и Y — две совместно распределенные случайные величины , то условное распределение Y при заданном X — это распределение вероятностей Y , когда известно, что X является определенным значением.

Например, в следующей двусторонней таблице показаны результаты опроса 100 человек, какой вид спорта им нравится больше всего: бейсбол, баскетбол или футбол.

Если мы хотим узнать вероятность того, что человек предпочитает определенный вид спорта, учитывая , что он мужчина, то это пример условного распределения.

Значение одной случайной величины известно (человек мужчина), но значение другой случайной величины неизвестно (мы не знаем его любимый вид спорта).

Чтобы найти условное распределение спортивных предпочтений среди мужчин, мы просто посмотрим на значения в строке для мужчин в таблице:

Пример условного распределения

Условное распределение будет рассчитываться как:

  • Мужчины, предпочитающие бейсбол: 13/48 = 0,2708.
  • Мужчины, предпочитающие баскетбол: 15/48 = 0,3125.
  • Мужчины, предпочитающие футбол: 20/48 = 0,4167.

Обратите внимание, что сумма вероятностей составляет 1: 13/48 + 15/48 + 20/48 = 48/48 = 1.

Мы можем использовать это условное распределение, чтобы ответить на такие вопросы, как: Учитывая, что человек — мужчина, какова вероятность того, что бейсбол — его любимый вид спорта?

Из условного распределения, которое мы рассчитали ранее, мы видим, что вероятность равна 0,2708 .

С технической точки зрения, когда мы вычисляем условное распределение, мы говорим, что нас интересует конкретная подгруппа всего населения. Субпопуляция в предыдущем примере была мужчинами:

Субпопуляция для условного распределения

И когда мы хотим рассчитать вероятность, связанную с этой подгруппой, мы говорим, что нас интересует конкретный интересующий персонаж.Интересующим персонажем в предыдущем примере был бейсбол:

Условное распределение в статистике

Чтобы найти вероятность того, что интересующий персонаж встречается в подгруппе, мы просто делим значение интересующего персонажа (например, 13) на общее количество значений в подгруппе (например, 48), чтобы получить 13/48 = 0,2708 .

Условные распределения и независимость

Мы можем сказать, что случайные величины X и Y независимы тогда и только тогда, когда условное распределение Y при заданном X для всех возможных реализаций X равно безусловному распределению Y .

Например, можем ли мы увидеть в предыдущей таблице, что события «предпочитает бейсбол» и «мужской» независимы?

Чтобы ответить на этот вопрос, рассчитаем следующие вероятности:

  • П (предпочитает бейсбол)
  • P(предпочитает бейсбол | мужчина) «предпочитает бейсбол, учитывая, что они мужчины

Вероятность того, что данный человек предпочитает бейсбол, равна:

  • P(предпочитает бейсбол) = 36/100 = 0,36 .

Вероятность того, что данный индивидуум предпочитает бейсбол, при условии, что он мужчина, равна

  • P(предпочитает бейсбол | мужчина) = 13/48 = 0,2708 .

Поскольку P (предпочитает бейсбол) не равно P (предпочитает бейсбол | мужчина), случайные величины спортивных предпочтений и пола не являются независимыми.

Зачем использовать условное распределение?

Распределения условной вероятности полезны, потому что мы часто собираем данные для двух переменных (таких как пол и спортивные предпочтения), но мы заинтересованы в ответах на вопросы о вероятности, когда нам случается знать значение одной из переменных.

В предыдущем примере мы рассмотрели сценарий, в котором мы знали, что данное лицо было мужчиной, и мы просто хотели узнать вероятность того, что человек предпочитает бейсбол.

В реальной жизни есть много случаев, когда нам известно значение одной переменной, и мы можем использовать условное распределение, чтобы найти вероятность того, что другая переменная примет определенное значение.

Дополнительные ресурсы

Что такое маргинальное распределение?
Что такое совместное распределение вероятностей?
Как найти условную относительную частоту в двусторонней таблице

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.