Как сравнивать блочные диаграммы (с примерами)

Как сравнивать блочные диаграммы (с примерами)

Коробчатая диаграмма — это тип графика, который отображает сводку из пяти чисел набора данных, которая включает в себя:

  • Минимальное значение
  • Первый квартиль (25-й процентиль)
  • Среднее значение
  • Третий квартиль (75-й процентиль)
  • Максимальное значение

Чтобы сделать блочную диаграмму, мы рисуем рамку от первого до третьего квартиля. Затем проводим вертикальную линию посередине. Наконец, мы рисуем «усы» от квартилей до минимального и максимального значения.

Блочные диаграммы полезны, потому что они позволяют нам быстро понять распределение значений в наборе данных. Они также полезны для сравнения двух разных наборов данных.

При сравнении двух или более блочных диаграмм мы можем ответить на четыре разных вопроса:

1. Как сравниваются средние значения? Мы можем сравнить вертикальную линию в каждом поле, чтобы определить, какой набор данных имеет более высокое медианное значение.

2. Как сравнивается дисперсия? Мы можем сравнить длину каждой ячейки (которая представляет собой расстояние между Q1 и Q3 — межквартильный диапазон), чтобы определить, какой набор данных более разбросан.

3. Как соотносится асимметрия? Чем ближе вертикальная линия к Q1, тем сильнее искажен набор данных. Чем ближе вертикальная линия к Q3, тем сильнее искажен набор данных.

4. Имеются ли выбросы? На ящичковых диаграммах выбросы обычно представлены крошечными кружками, которые выходят за пределы любого уса. Наблюдение считается выбросом, если оно соответствует одному из следующих критериев:

  • Наблюдение меньше Q1 – 1,5*IQR
  • Наблюдение больше, чем Q3 + 1,5 * IQR

В следующем примере показано, как сравнить две разные диаграммы и ответить на эти четыре вопроса.

Пример: сравнение блочных диаграмм

Следующие наборы данных отображают экзаменационные баллы для учащихся, которые использовали один из двух методов обучения для подготовки к экзамену:

Способ 1: 78, 78, 79, 80, 80, 82, 82, 83, 83, 86, 86, 86, 86, 87, 87, 87, 88, 88, 88, 91

Способ 2: 66, 66, 66, 67, 68, 70, 72, 75, 75, 78, 82, 83, 86, 88, 89, 90, 93, 94, 95, 98

Если мы создадим диаграммы для каждого набора данных, вот как они будут выглядеть:

Пример сравнения коробчатых диаграмм

Мы можем сравнить эти две диаграммы и ответить на следующие четыре вопроса:

1. Как сравниваются средние значения? Линия в середине диаграммы для Метода обучения 1 выше, чем линия для Метода обучения 2, что указывает на то, что учащиеся, использовавшие Метод обучения 1, имели более высокий средний балл на экзамене.

2. Как сравнивается дисперсия? Блочная диаграмма для Метода обучения 2 намного длиннее, чем для Метода обучения 1, что указывает на то, что экзаменационные баллы гораздо более разбросаны среди учащихся, которые использовали Метод обучения 2.

3. Как соотносится асимметрия? Линия в середине диаграммы для Метода обучения 1 близка к Q3, что указывает на то, что распределение экзаменационных баллов для студентов, которые использовали Метод обучения 1, имеет отрицательную асимметрию. Наоборот, линия в середине диаграммы для Метода исследования 2 находится рядом с центром коробки, что означает, что распределение баллов имеет небольшую асимметрию.

4. Имеются ли выбросы? Ни на одной из коробочных диаграмм нет крошечных кругов, выходящих за пределы верхних или нижних усов, что означает, что ни в одном наборе данных не было явных выбросов.

Дополнительные ресурсы

Как создавать и интерпретировать диаграммы в Excel
Как создавать и интерпретировать диаграммы в SPSS
Как создать несколько блочных диаграмм в R
Как создавать и интерпретировать диаграммы в Stata

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.