Влияют ли выбросы на межквартильный диапазон (IQR)?

Влияют ли выбросы на межквартильный диапазон (IQR)?

В статистике нас часто интересует, насколько «разбросаны» значения в распределении.

Одним из популярных способов измерения разброса является межквартильный размах , который рассчитывается как разница между первым и третьим квартилями в наборе данных. Квартили — это просто значения, которые делят набор данных на четыре равные части.

Пример. Расчет межквартильного диапазона

В следующем примере показано, как рассчитать межквартильный диапазон для заданного набора данных:

Дисперсия и стандартное отклонение набора данных

Шаг 1: Расположите значения от меньшего к большему.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98

2. Найдите медиану.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88 , 88, 88, 90, 90, 92, 92, 94, 96, 98

В этом случае медиана находится между 85 и 88.

3. Медиана разбивает набор данных на две половины. Медиана нижней половины — это нижний квартиль, а медиана верхней половины — это верхний квартиль:

58, 66, 71, 73, 74, 77 , 78, 82, 84, 85, 88, 88, 88, 90, 90, 92 , 92, 94, 96, 98

4. Рассчитайте межквартильный размах.

В этом случае первый квартиль — это среднее двух средних значений в нижней половине набора данных (75,5), а третий квартиль — это среднее двух средних значений в верхней половине набора данных (91).

Таким образом, межквартильный размах составляет 91 – 75,5 = 15,5 .

На межквартильный диапазон не влияют выбросы

Одна из причин, по которой люди предпочитают использовать межквартильный диапазон (IQR) при расчете «разброса» набора данных, заключается в том, что он устойчив к выбросам. Поскольку IQR — это просто диапазон средних 50 % значений данных, на него не влияютэкстремальные выбросы .

Чтобы продемонстрировать это, рассмотрим следующий набор данных:

[1, 4, 8, 11, 13, 17, 17, 20]

Вот различные меры распространения для этого набора данных:

  • Межквартильный диапазон: 11
  • Диапазон: 19
  • Стандартное отклонение: 6,26
  • Разница: 39,23

Теперь рассмотрим тот же набор данных, но с добавленным к нему экстремальным выбросом:

[1, 4, 8, 11, 13, 17, 17, 20, 150 ]

Вот различные меры распространения для этого набора данных:

  • Межквартильный размах: 12,5
  • Диапазон: 149
  • Стандартное отклонение: 43,96
  • Разница: 1932,84

Обратите внимание, что межквартильный диапазон меняется незначительно, с 11 до 12,5. Однако резко меняются все остальные меры дисперсии.

Это показывает, что на межквартильный диапазон не влияют выбросы, как на другие показатели дисперсии. По этой причине это надежный способ измерения разброса средних 50% значений в любом распределении.

Дальнейшее чтение:

Меры рассеивания
Калькулятор межквартильного диапазона

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.