Как определить асимметрию в ящичковых диаграммах


Коробчатая диаграмма — это тип графика, который отображает сводку из пяти чисел набора данных, которая включает в себя:

  • Минимальное значение
  • Первый квартиль (25-й процентиль)
  • Среднее значение
  • Третий квартиль (75-й процентиль)
  • Максимальное значение

Мы используем следующий процесс, чтобы нарисовать блочную диаграмму:

  • Нарисуйте прямоугольник от первого квартиля (Q1) до третьего квартиля (Q3).
  • Затем нарисуйте линию внутри поля посередине
  • Затем проведите «усы» от квартилей к минимальному и максимальному значениям

Мы можем определить, является ли распределение асимметричным, основываясь на расположении медианного значения на ящичковой диаграмме.

Когда медиана находится ближе к основанию ящика, а ус короче на нижнем конце ящика, распределение скошено вправо (или «положительно» скошено).

Когда медиана ближе к верхней части прямоугольника, а ус короче на верхнем конце прямоугольника, распределение имеет асимметрию влево (или «отрицательную» асимметрию).

Когда медиана находится в середине прямоугольника, а усы примерно равны с каждой стороны, распределение является симметричным (или «отсутствием» перекоса).

В следующих примерах показано, как использовать блочные диаграммы, чтобы определить, является ли распределение асимметричным вправо, асимметричным влево или не имеет асимметрии.

Пример 1: Правостороннее распределение

Распределение годовых доходов домохозяйств в Соединенных Штатах смещено вправо. Большинство домохозяйств зарабатывают от 40 до 80 тысяч долларов в год, но в распределении есть длинный правый хвост, который представляет домохозяйства, которые зарабатывают гораздо больше.

Если бы мы создали блочную диаграмму для визуализации распределения доходов домохозяйств, она выглядела бы примерно так:

Обратите внимание, что вертикальная линия внутри прямоугольника, представляющая медиану, намного ближе к первому квартилю, чем к третьему квартилю, что означает, что распределение смещено вправо.

Пример 2: Распределение с асимметрией влево

Распределение возраста умерших в большинстве популяций асимметрично влево. Большинство людей доживает до 70–80 лет, и все меньше и меньше людей доживает до этого возраста.

Если бы мы создали блочную диаграмму для визуализации распределения возраста смертей, она выглядела бы примерно так:

Обратите внимание, что вертикальная линия внутри прямоугольника, представляющая медиану, намного ближе к третьему квартилю, чем к первому квартилю, что означает, что распределение смещено влево.

Пример 3: Симметричное распределение

Распределение роста самцов примерно симметрично и не имеет перекоса. Например, средний рост мужчины в Соединенных Штатах составляет примерно 69,1 дюйма. Распределение высоты примерно симметрично: некоторые из них ниже, а некоторые выше.

Если бы мы создали блочную диаграмму для визуализации распределения роста мужчин в Соединенных Штатах, она выглядела бы примерно так:

Обратите внимание, что вертикальная линия внутри прямоугольника, представляющая медиану, одинаково близка к первому квартилю и третьему квартилю, что означает, что распределение симметрично и не имеет перекоса.

Дополнительные ресурсы

Левостороннее и правостороннее распределения
Как сравнивать блочные диаграммы (с примерами)
Как создать параллельные диаграммы в Excel