Что такое совместное распределение вероятностей?

Что такое совместное распределение вероятностей?

Двусторонняя таблица частот — это таблица, в которой отображаются частоты (или «числа») для двух категориальных переменных.

Например, в следующей двусторонней таблице показаны результаты опроса 100 человек, какой вид спорта им нравится больше всего: бейсбол, баскетбол или футбол.

В строках указан пол респондента, а в столбцах — какой вид спорта он выбрал:

В этом примере есть две переменные: Спорт и Пол.

Совместное распределение вероятностей просто описывает вероятность того, что данный индивидуум примет два конкретных значения переменных.

Слово «совместный» происходит от того факта, что нас интересует вероятность того, что два события произойдут одновременно.

Например, из 100 человек было 13 мужчин , которые выбрали бейсбол в качестве своего любимого вида спорта.

Таким образом, мы могли бы сказать, что совместная вероятность того, что данное лицо является мужчиной и выбирает бейсбол в качестве своего любимого вида спорта, составляет 13/100 = 0,13 или 13% .

Записано в математической нотации:

P(Пол = Мужской, Спорт = Бейсбол) = 13/100 = 0,13 .

Мы можем использовать этот процесс для вычисления всего совместного распределения вероятностей:

  • P (пол = мужчина, спорт = бейсбол) = 13/100 = 0,13 .
  • P(Пол = Мужской, Спорт = Баскетбол) = 15/100 = 0,15
  • P (пол = мужчина, спорт = футбол) = 20/100 = 0,20
  • P (пол = женщина, спорт = бейсбол) = 23/100 = 0,23
  • P(Пол = Женский, Спорт = Баскетбол) = 16/100 = 0,16
  • P (пол = женщина, спорт = футбол) = 13/100 = 0,13 .

Обратите внимание, что сумма вероятностей равна 1 или 100% .

Зачем использовать совместное распределение вероятностей?

Совместные распределения вероятностей полезны, потому что мы часто собираем данные по двум переменным (например, спорту и полу) и нам интересно отвечать на вопросы, связанные с обеими переменными.

Например, мы можем захотеть понять, насколько вероятно, что данный индивидуум в популяции является мужчиной и предпочитает бейсбол в качестве своего любимого вида спорта.

Или нам может быть интересно понять, насколько вероятно, что данный человек является женщиной и предпочитает футбол как свой любимый вид спорта.

Совместное распределение вероятностей может помочь нам ответить на эти вопросы.

Используйте следующие примеры в качестве практики, чтобы лучше понять совместное распределение вероятностей.

Пример 1

В следующей двусторонней таблице показаны результаты опроса 238 человек, какой жанр кино им нравится больше всего:

Пример маргинального распределения с двусторонней таблицей

Вопрос: Какова вероятность того, что данный человек является женщиной и предпочитает драму в качестве своего любимого жанра кино?

Ответ: P (пол = женский, жанр = драма) = 58/238 = 0,244 = 24,4%

Пример 2

В следующей двусторонней таблице показаны экзаменационные баллы 64 учеников в классе в зависимости от того, сколько часов они потратили на обучение:

Пример маргинального распределения

Вопрос: Какова вероятность того, что данный человек занимается 2 часа и получает от 91 до 100 баллов?

Ответ: P(обучение = 2 часа, балл = 91-100) = 3/64 = 0,047 = 4,7%

Дополнительные ресурсы

Что такое маргинальное распределение?
Как найти условную относительную частоту в двусторонней таблице

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.