Гистограмма относительной частоты — это график, отображающий относительную частоту значений в наборе данных.
В этом руководстве объясняется, как создать гистограмму относительной частоты в R с помощью функции histogram() из решетки , которая использует следующий синтаксис:
гистограмма (x, тип)
куда:
- х: данные
- тип: тип гистограммы относительной частоты, которую вы хотите создать; параметры включают процент, количество и плотность.
Гистограмма по умолчанию
Сначала загрузите пакет решетки :
library(lattice)
По умолчанию этот пакет создает гистограмму относительной частоты с процентами по оси Y:
#create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)
#create relative frequency histogram
histogram(data)
Изменение гистограммы
Мы можем изменить гистограмму, включив в нее заголовок, разные метки осей и другой цвет, используя следующие аргументы:
- главное: название
- xlab: метка оси x
- ylab: метка оси Y
- col: цвет заливки для использования в гистограмме
Например:
#modify the histogram
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue')
Изменение количества ячеек
Мы можем указать количество бинов для использования в гистограмме, используя аргумент breaks :
#modify the number of bins
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue',
breaks=15 )
Чем больше бинов вы укажете, тем более детально вы сможете просмотреть свои данные. И наоборот, чем меньше бинов вы укажете, тем более агрегированными станут данные:
#modify the number of bins
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue',
breaks=3 )
Связанный: Используйте правило Стерджеса, чтобы определить оптимальное количество интервалов для использования в гистограмме.