Как создать гистограмму относительной частоты в R


Гистограмма относительной частоты — это график, отображающий относительную частоту значений в наборе данных.

В этом руководстве объясняется, как создать гистограмму относительной частоты в R с помощью функции histogram() из решетки , которая использует следующий синтаксис:

гистограмма (x, тип)

куда:

  • х: данные
  • тип: тип гистограммы относительной частоты, которую вы хотите создать; параметры включают процент, количество и плотность.

Гистограмма по умолчанию

Сначала загрузите пакет решетки :

library(lattice)

По умолчанию этот пакет создает гистограмму относительной частоты с процентами по оси Y:

#create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)

#create relative frequency histogram
histogram(data) 

Изменение гистограммы

Мы можем изменить гистограмму, включив в нее заголовок, разные метки осей и другой цвет, используя следующие аргументы:

  • главное: название
  • xlab: метка оси x
  • ylab: метка оси Y
  • col: цвет заливки для использования в гистограмме

Например:

#modify the histogram
histogram(data,
 main='Points per Game by Player',
 xlab='Points per Game',
 col='steelblue')

Изменение количества ячеек

Мы можем указать количество бинов для использования в гистограмме, используя аргумент breaks :

#modify the number of bins
histogram(data,
 main='Points per Game by Player',
 xlab='Points per Game',
 col='steelblue',
 breaks=15 )

Чем больше бинов вы укажете, тем более детально вы сможете просмотреть свои данные. И наоборот, чем меньше бинов вы укажете, тем более агрегированными станут данные:

#modify the number of bins
histogram(data,
 main='Points per Game by Player',
 xlab='Points per Game',
 col='steelblue',
 breaks=3 )

Связанный: Используйте правило Стерджеса, чтобы определить оптимальное количество интервалов для использования в гистограмме.