Негруппированное частотное распределение: определение и пример

Негруппированное частотное распределение: определение и пример

Предположим, мы проводим опрос, в ходе которого опрашиваем 15 домохозяйств, сколько домашних животных у них дома. Результаты приведены ниже:

1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8

Один из способов обобщить эти результаты — создать частотное распределение , которое говорит нам, как часто разные значения встречаются в наборе данных.

Часто мы используем сгруппированные частотные распределения , в которых мы создаем группы значений, а затем суммируем, сколько наблюдений из набора данных попадает в эти группы.

Вот пример сгруппированного частотного распределения для данных нашего опроса:

Сначала мы создали группы размером 2, затем подсчитали, сколько отдельных наблюдений из набора данных попало в каждую группу. Например:

  • 7 семей имели 1 или 2 домашних животных
  • В 3 семьях было 3 или 4 домашних животных
  • В 3 семьях было 5 или 6 домашних животных.
  • В 2 семьях было 7 или 8 домашних животных.

Другой тип частотного распределения, который мы могли бы создать, — это несгруппированное частотное распределение , которое отображает частоту каждого отдельного значения данных, а не группы значений данных.

Вот пример несгруппированного частотного распределения для данных нашего опроса:

Пример несгруппированного частотного распределения

Этот тип частотного распределения позволяет нам напрямую видеть, как часто в нашем наборе данных встречались разные значения. Например:

  • 4 семьи имели 1 домашнее животное
  • 3 семьи имели 2 домашних животных
  • 2 семьи имели 3 домашних животных
  • В 1 семье было 4 питомца

И так далее.

Когда использовать несгруппированные частотные распределения

Несгруппированные частотные распределения могут быть полезны, когда вы хотите увидеть, как часто каждое отдельное значение встречается в наборе данных.

Обратите внимание, что разгруппированные частотные распределения лучше всего работают с небольшими наборами данных, в которых есть только несколько уникальных значений.

Например, в данных нашего предыдущего опроса было только 8 уникальных значений, поэтому имело смысл создать негруппированное частотное распределение.

Однако, если бы у нас был набор данных с сотнями или тысячами уникальных значений, негруппированное частотное распределение было бы невероятно длинным и из него было бы трудно собрать информацию.

Для больших наборов данных имеет смысл построить сгруппированные частотные распределения.

Как визуализировать несгруппированные частотные распределения

Самый простой способ визуализировать значения в несгруппированном распределении частот — создать многоугольник частот , который отображает частоты каждого отдельного значения в простой диаграмме.

Вот как будет выглядеть полигон частот для наших выборочных данных:

Многоугольник частот для несгруппированного распределения частот

Это помогает нам быстро понять, как часто каждое значение встречается в наборе данных.

В качестве альтернативы мы могли бы создать гистограмму для отображения тех же данных, используя столбцы, а не одну линию:

Гистограмма для несгруппированного частотного распределения

Обе диаграммы позволяют нам быстро понять распределение значений в нашем наборе данных.

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.