Как интерпретировать межквартильный диапазон (с примерами)


Межквартильный диапазон набора данных, часто сокращенно IQR, представляет собой разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных.

Проще говоря, он измеряет разброс средних 50% значений.

IQR = Q3 – Q1

Например, предположим, что у нас есть следующий набор данных, который показывает высоту 17 различных растений (в дюймах) в лаборатории:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Согласно калькулятору межквартильного диапазона, межквартильный диапазон (IQR) для этого набора данных рассчитывается как:

  • Q1: 12
  • Q3: 26,5
  • IQR = Q3 – Q1 = 14,5

Это говорит нам о том, что средние 50% значений в наборе данных имеют разброс в 14,5 дюймов.

Почему межквартильный диапазон полезен

Межквартильный диапазон — это один из способов измерения разброса значений в наборе данных, но есть и другие меры разброса , такие как:

  • Диапазон: измеряет разницу между минимальным и максимальным значением в наборе данных.
  • Стандартное отклонение: измеряет типичное отклонение отдельных значений от среднего значения в наборе данных.

Преимущество использования межквартильного диапазона (IQR) для измерения разброса значений в наборе данных заключается в том, что на него не влияют экстремальные выбросы.

Например, очень маленькое или очень большое значение в наборе данных не повлияет на расчет IQR, поскольку IQR использует только значения в 25-м процентиле и 75-м процентиле набора данных.

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Этот набор данных имеет следующие меры распространения

  • ИКР: 14,5
  • Стандартное отклонение: 9,25
  • Диапазон: 31

Однако подумайте, есть ли в наборе данных один экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Мы могли бы использовать калькулятор, чтобы найти следующие меры распространения для этого набора данных:

  • IQR: 15
  • Стандартное отклонение: 85,02
  • Диапазон: 377

Обратите внимание, что межквартильный размах практически не меняется, когда присутствует выброс, в то время как стандартное отклонение и размах резко меняются.

Сравнение межквартильных диапазонов между наборами данных

Межквартильный диапазон также можно использовать для сравнения разброса значений между различными наборами данных.

Например, предположим, что у нас есть три набора данных со следующими значениями IQR:

  • IQR набора данных 1: 13,5
  • IQR набора данных 2: 24,4
  • IQR набора данных 3: 8,7

Это говорит нам о том, что разброс средних 50% значений является наибольшим для набора данных 2 и наименьшим для набора данных 3.

Дополнительные ресурсы

Как рассчитать межквартильный диапазон в Excel
Как рассчитать межквартильный диапазон в Python
Как найти выбросы, используя межквартильный диапазон
Калькулятор межквартильного диапазона

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.