Как интерпретировать межквартильный диапазон (с примерами)


Межквартильный диапазон набора данных, часто сокращенно IQR, представляет собой разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных.

Проще говоря, он измеряет разброс средних 50% значений.

IQR = Q3 – Q1

Например, предположим, что у нас есть следующий набор данных, который показывает высоту 17 различных растений (в дюймах) в лаборатории:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Согласно калькулятору межквартильного диапазона, межквартильный диапазон (IQR) для этого набора данных рассчитывается как:

  • Q1: 12
  • Q3: 26,5
  • IQR = Q3 – Q1 = 14,5

Это говорит нам о том, что средние 50% значений в наборе данных имеют разброс в 14,5 дюймов.

Почему межквартильный диапазон полезен

Межквартильный диапазон — это один из способов измерения разброса значений в наборе данных, но есть и другие меры разброса , такие как:

  • Диапазон: измеряет разницу между минимальным и максимальным значением в наборе данных.
  • Стандартное отклонение: измеряет типичное отклонение отдельных значений от среднего значения в наборе данных.

Преимущество использования межквартильного диапазона (IQR) для измерения разброса значений в наборе данных заключается в том, что на него не влияют экстремальные выбросы.

Например, очень маленькое или очень большое значение в наборе данных не повлияет на расчет IQR, поскольку IQR использует только значения в 25-м процентиле и 75-м процентиле набора данных.

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Этот набор данных имеет следующие меры распространения

  • ИКР: 14,5
  • Стандартное отклонение: 9,25
  • Диапазон: 31

Однако подумайте, есть ли в наборе данных один экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Мы могли бы использовать калькулятор, чтобы найти следующие меры распространения для этого набора данных:

  • IQR: 15
  • Стандартное отклонение: 85,02
  • Диапазон: 377

Обратите внимание, что межквартильный размах практически не меняется, когда присутствует выброс, в то время как стандартное отклонение и размах резко меняются.

Сравнение межквартильных диапазонов между наборами данных

Межквартильный диапазон также можно использовать для сравнения разброса значений между различными наборами данных.

Например, предположим, что у нас есть три набора данных со следующими значениями IQR:

  • IQR набора данных 1: 13,5
  • IQR набора данных 2: 24,4
  • IQR набора данных 3: 8,7

Это говорит нам о том, что разброс средних 50% значений является наибольшим для набора данных 2 и наименьшим для набора данных 3.

Дополнительные ресурсы

Как рассчитать межквартильный диапазон в Excel
Как рассчитать межквартильный диапазон в Python
Как найти выбросы, используя межквартильный диапазон
Калькулятор межквартильного диапазона