Что такое мультимодальная дистрибуция?

Что такое мультимодальная дистрибуция?

Мультимодальное распределение — это вероятностное распределение с двумя или более модами.

Если вы создадите гистограмму для визуализации мультимодального распределения, вы заметите, что она имеет более одного пика:

Мультимодальное распределение

Если распределение имеет ровно два пика, то оно считается бимодальным распределением , которое является особым типом мультимодального распределения.

Это отличается от одномодального распределения, которое имеет только один пик:

Хотя одномодальные распределения, такие как нормальное распределение , чаще всего используются для объяснения тем в статистике, мультимодальные распределения на самом деле довольно часто встречаются на практике, поэтому полезно знать, как их распознавать и анализировать.

Примеры мультимодальных распределений

Вот несколько примеров мультимодальных распределений.

Пример 1: Распределение баллов за экзамен

Предположим, профессор дает экзамен своему классу. Кто-то из студентов учился, а кто-то нет. Когда профессор создает гистограмму экзаменационных баллов, она следует мультимодальному распределению с одним пиком вокруг низких баллов для студентов, которые не учились, и другим пиком вокруг высоких баллов для студентов, которые учились:

Пример мультимодального распределения

Пример 2: Высота разных видов растений

Предположим, ученый идет по полю и измеряет высоту различных растений. Сама того не осознавая, она измеряет рост трех разных видов: один довольно высокий, другой среднего роста и третий довольно низкий.

Когда она создает гистограмму для визуализации распределения высоты, она обнаруживает, что она мультимодальна — каждый пик представляет наиболее распространенную высоту трех разных видов.

Пример мультимодального распределения

Пример 3: Распределение клиентов

Владелец ресторана отслеживает, сколько клиентов посещает каждый час. Когда он создает гистограмму для визуализации распределения клиентов, он обнаруживает, что распределение является мультимодальным — есть пик в обеденное время и еще один пик во время ужина.

Что вызывает мультимодальные распределения?

Обычно существует одна из двух основных причин мультимодальных распределений:

1. Несколько групп объединены в одну кучу.

Мультимодальные распределения могут возникать, когда вы собираете данные для нескольких групп, не осознавая этого.

Например, если ученый по незнанию измеряет высоту трех разных видов растений, расположенных на одном поле, распределение всех растений будет мультимодальным при размещении на одной и той же гистограмме.

2. Существует лежащий в основе феномен.

Мультимодальные распределения также могут возникать из-за некоторых лежащих в их основе явлений.

Например, количество клиентов, посещающих ресторан каждый час, следует мультимодальному распределению, поскольку люди, как правило, едят вне дома в два разных времени: обед и ужин. Это основное человеческое поведение вызывает мультимодальное распределение.

Как анализировать мультимодальные распределения

Мы часто описываем распределения, используя среднее значение или медиану , так как это дает нам представление о том, где находится «центр» распределения.

К сожалению, для бимодального распределения бесполезно знать среднее значение и медиану. Например, средний балл за экзамен для студентов в приведенном выше примере равен 81:

Однако очень немногие студенты на самом деле набрали близко к 81 баллу. В данном случае среднее значение вводит в заблуждение. Большинство студентов на самом деле набрали около 74 или около 88 баллов.

Лучший способ анализа и интерпретации бимодальных распределений — просто разбить данные на две отдельные группы, а затем проанализировать расположение центра и разброс для каждой группы отдельно.

Например, мы можем разбить результаты экзамена на «низкие баллы» и «высокие баллы», а затем найти среднее значение и стандартное отклонение для каждой группы.

При расчете сводной статистики для данного распределения, например, среднего значения, медианы или стандартного отклонения, обязательно визуализируйте распределение, чтобы определить, является ли оно одномодальным или мультимодальным.

Если распределение является мультимодальным, его описание с использованием одного среднего значения, медианы или стандартного отклонения может ввести в заблуждение.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.