Как создать гистограмму двух переменных в R


Гистограмма — это полезный способ визуализации распределения значений для данной переменной.

Чтобы создать гистограмму для одной переменной в R, вы можете использовать функцию hist().А чтобы создать гистограмму для двух переменных в R, вы можете использовать следующий синтаксис:

hist(variable1, col='red')
hist(variable2, col='blue', add= TRUE )

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: создание гистограммы двух переменных в R

Следующий код показывает, как создать гистограмму двух переменных в R:

#make this example reproducible
set. seed (1)

#define data
x1 = rnorm(1000, mean=0.6, sd=0.1)
x2 = rnorm(1000, mean=0.4, sd=0.1)

#plot two histograms in same graph
hist(x1, col='red')
hist(x2, col='blue', add= TRUE )

Поскольку значения гистограмм перекрываются, рекомендуется использовать цвета rgb() с повышенной прозрачностью:

#make this example reproducible
set. seed (1)

#define data
x1 = rnorm(1000, mean=0.6, sd=0.1)
x2 = rnorm(1000, mean=0.4, sd=0.1)

#plot two histograms in same graph
hist(x1, col=rgb(0,0,1,0.2), xlim=c(0, 1),
 xlab='Values', ylab='Frequency', main='Histogram for two variables')
hist(x2, col=rgb(1,0,0,0.2), add= TRUE ) 

Вы также можете добавить легенду, чтобы упростить интерпретацию гистограмм:

#make this example reproducible
set. seed (1)

#define data
x1 = rnorm(1000, mean=0.6, sd=0.1)
x2 = rnorm(1000, mean=0.4, sd=0.1)

#plot two histograms in same graph
hist(x1, col=rgb(0,0,1,0.2), xlim=c(0, 1),
 xlab='Values', ylab='Frequency', main='Histogram for two variables')
hist(x2, col=rgb(1,0,0,0.2), add= TRUE )

#add legend
legend('topright', c('Variable 1', 'Variable 2'),
 fill=c(rgb(0,0,1,0.2), rgb(1,0,0,0.2)))

Вы можете найти больше руководств по R на этой странице .