Когда следует использовать коробочную диаграмму? (3 сценария)

Когда следует использовать коробочную диаграмму? (3 сценария)

Коробчатая диаграмма — это тип графика, который отображает сводку из пяти чисел набора данных, которая включает в себя:

  • Минимальное значение
  • Первый квартиль (25-й процентиль)
  • Среднее значение
  • Третий квартиль (75-й процентиль)
  • Максимальное значение

Мы используем три простых шага, чтобы создать ящичковую диаграмму для любого набора данных:

  • 1. Нарисуйте прямоугольник от первого до третьего квартиля.
  • 2. Нарисуйте вертикальную линию посередине
  • 3. Нарисуйте «усы» от квартилей до минимального и максимального значения

Обычно мы создаем диаграммы в одном из трех сценариев:

Сценарий 1. Чтобы визуализировать распределение значений в наборе данных.

Блочная диаграмма позволяет нам быстро визуализировать распределение значений в наборе данных и увидеть, где расположены пять сводных значений чисел.

Сценарий 2: Для сравнения двух или более дистрибутивов.

Боковая диаграмма рядом позволяет нам визуализировать различия между двумя или более распределениями и сравнивать медианные значения и разброс значений между распределениями.

Сценарий 3: выявить выбросы.

На ящичковых диаграммах выбросы обычно представлены крошечными кружками, которые выходят за пределы любого уса. Наблюдение считается выбросом, если оно соответствует одному из следующих критериев:

  • Наблюдение меньше, чем Q1 - 1,5 * (межквартильный диапазон)
  • Наблюдение больше, чем Q3 + 1,5 * (межквартильный диапазон)

Создавая блочную диаграмму, мы можем быстро увидеть, есть ли в распределении какие-либо выбросы.

В следующих примерах показано, как мы будем использовать блочную диаграмму в каждом сценарии.

Сценарий 1. Визуализация распределения значений в наборе данных

Предположим, тренер по баскетболу хочет визуализировать распределение очков, набранных игроками его команды, поэтому он создает следующую коробчатую диаграмму:

Основываясь на этой блочной диаграмме, он может быстро увидеть следующие значения:

  • Минимум: 5
  • Q1 (первый квартиль): около 8
  • Медиана: около 13
  • Q3 (третий квартиль): около 18
  • Максимум: 25

Это позволяет тренеру быстро увидеть, что очки, набранные игроками, колеблются от 5 до 25, медиана набранных очков составляет около 13, а 50% его игроков набирают от 8 до 18 очков за игру.

Сценарий 2: сравнение двух или более дистрибутивов

Предположим, спортивный аналитик хочет сравнить распределение очков, набранных баскетболистами в трех разных командах, поэтому он создает следующие диаграммы:

Используя эти графики, он может быстро увидеть, что у команды C самые высокие медианные баллы, а у команды A самые низкие медианные баллы.

Он также может быстро увидеть, что команда Б имеет самый высокий разброс набранных очков, поскольку блок-график для команды Б имеет самый длинный блок.

Сценарий 3: определение выбросов

Предположим, тренер по баскетболу хочет знать, не является ли кто-либо из его игроков исключением с точки зрения набранных очков. Он решает создать следующую коробочную диаграмму, чтобы визуализировать распределение очков, набранных его игроками:

Используя этот график, тренер может увидеть, что крошечная точка в верхней части графика указывает на выброс.

В частности, один из игроков набрал около 50 очков, что считается выбросом по сравнению со всеми другими набранными очками.

Дополнительные ресурсы

Следующие учебные пособия предлагают подробные объяснения того, как использовать коробчатые диаграммы на практике:

Как найти межквартильный диапазон (IQR) прямоугольной диаграммы
Как определить асимметрию в ящичковых диаграммах
Как сравнивать блочные диаграммы

В следующих руководствах объясняется, как создавать диаграммы в различных статистических программах:

Как сделать блок-схему в Google Sheets
Как создать блочную диаграмму в SPSS
Как создавать параллельные диаграммы в Excel
Как создавать параллельные диаграммы в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.