Почему диапазон важен в статистике?

Почему диапазон важен в статистике?

В статистике диапазон представляет собой разницу между наименьшим и наибольшим значением в наборе данных.

Например, предположим, что у нас есть следующий набор данных:

Набор данных: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26

Мы можем использовать следующую формулу для расчета диапазона:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 26 – 3
  • Диапазон = 23

Диапазон составляет 23.Представляет собой разницу между наименьшим и наибольшим значениями в наборе данных.

В статистике диапазон важен по следующим причинам:

Причина 1 : это говорит нам о распространении всего набора данных.

Причина 2 : сообщает нам, какие экстремальные значения возможны в данном наборе данных.

Следующие примеры иллюстрируют каждую из этих причин на практике.

Причина 1: диапазон говорит нам о разбросе всего набора данных

Диапазон говорит нам о распространении всего набора данных.

Например, предположим, что у нас есть следующий набор данных, который показывает результаты экзаменов 20 разных учеников в классе:

Диапазон экзаменационных баллов будет рассчитываться как:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 98 – 68
  • Диапазон = 30

Диапазон оказывается равным 30.Это представляет собой разницу между самой высокой оценкой экзамена и самой низкой оценкой экзамена в классе.

Зная только эту метрику, учитель класса может быстро получить представление о разбросе значений экзаменационных баллов среди всех учащихся.

Причина 2: Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.

Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.

Например, предположим, что у риелтора есть доступ к базе данных, содержащей цену продажи 100 000 домов в определенном городе в США:

Предположим, мы используем какое-то статистическое программное обеспечение (например, Excel , R , Python и т. д.), чтобы вычислить диапазон этого набора данных и найти следующее:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 854 000 – 194 000
  • Диапазон = 660 000

Если у риелтора есть клиент с бюджетом на покупку менее 194 000 долларов или более 854 000 долларов, риелтор может сразу узнать, что в этом конкретном городе не будет домов, соответствующих критериям покупки.

Недостаток использования диапазона

Диапазон имеет один недостаток: на него влияют выбросы .

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Диапазон этого набора данных составляет 32 – 1 = 31 .

Однако подумайте, есть ли в наборе данных один экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Диапазон этого набора данных теперь будет 378 – 1 = 377 .

Обратите внимание, как резко меняется диапазон в результате одного выброса.

Перед вычислением диапазона любого набора данных рекомендуется сначала проверить, нет ли каких-либо выбросов, которые могут привести к тому, что диапазон будет вводить в заблуждение.

Дополнительные ресурсы

В следующих руководствах объясняется важность других показателей в статистике:

Почему среднее значение важно в статистике?
Почему медиана важна в статистике?
Почему режим важен в статистике?
Почему стандартное отклонение важно в статистике?

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.