Межквартильный диапазон набора данных, часто сокращенно IQR, представляет собой разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных.
Проще говоря, он измеряет разброс средних 50% значений.
IQR = Q3 – Q1
Например, предположим, что у нас есть следующий набор данных, который показывает высоту 17 различных растений (в дюймах) в лаборатории:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Согласно калькулятору межквартильного диапазона, межквартильный диапазон (IQR) для этого набора данных рассчитывается как:
- Q1: 12
- Q3: 26,5
- IQR = Q3 – Q1 = 14,5
Это говорит нам о том, что средние 50% значений в наборе данных имеют разброс в 14,5 дюймов.
Почему межквартильный диапазон полезен
Межквартильный диапазон — это один из способов измерения разброса значений в наборе данных, но есть и другие меры разброса , такие как:
- Диапазон: измеряет разницу между минимальным и максимальным значением в наборе данных.
- Стандартное отклонение: измеряет типичное отклонение отдельных значений от среднего значения в наборе данных.
Преимущество использования межквартильного диапазона (IQR) для измерения разброса значений в наборе данных заключается в том, что на него не влияют экстремальные выбросы.
Например, очень маленькое или очень большое значение в наборе данных не повлияет на расчет IQR, поскольку IQR использует только значения в 25-м процентиле и 75-м процентиле набора данных.
Чтобы проиллюстрировать это, рассмотрим следующий набор данных:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Этот набор данных имеет следующие меры распространения
- ИКР: 14,5
- Стандартное отклонение: 9,25
- Диапазон: 31
Однако подумайте, есть ли в наборе данных один экстремальный выброс:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Мы могли бы использовать калькулятор, чтобы найти следующие меры распространения для этого набора данных:
- IQR: 15
- Стандартное отклонение: 85,02
- Диапазон: 377
Обратите внимание, что межквартильный размах практически не меняется, когда присутствует выброс, в то время как стандартное отклонение и размах резко меняются.
Сравнение межквартильных диапазонов между наборами данных
Межквартильный диапазон также можно использовать для сравнения разброса значений между различными наборами данных.
Например, предположим, что у нас есть три набора данных со следующими значениями IQR:
- IQR набора данных 1: 13,5
- IQR набора данных 2: 24,4
- IQR набора данных 3: 8,7
Это говорит нам о том, что разброс средних 50% значений является наибольшим для набора данных 2 и наименьшим для набора данных 3.
Дополнительные ресурсы
Как рассчитать межквартильный диапазон в Excel
Как рассчитать межквартильный диапазон в Python
Как найти выбросы, используя межквартильный диапазон
Калькулятор межквартильного диапазона