Как создать диаграмму рассеяния в R с несколькими переменными


Вы можете использовать следующий базовый синтаксис для создания диаграммы рассеяния с несколькими переменными в R:

#create scatterplot of x1 vs. y1
plot(x1, y1, col='red')

#add scatterplot of x2 vs. y2
points(x2, y2, col='blue')

#add legend
legend(1, 25, legend=c('Data 1', 'Data 2'), pch=c(19, 19), col=c('red', 'blue'))

В следующих примерах показано, как использовать этот синтаксис на практике.

Пример 1: Создайте диаграмму рассеяния с двумя переменными

В следующем коде показано, как создать диаграмму рассеяния с двумя разными переменными:

#define datasets
x1 = c(1, 3, 6, 11, 19, 20)
y1 = c(7, 10, 11, 12, 18, 25)

x2 = c(1, 3, 8, 13, 17, 19)
y2 = c(9, 15, 18, 21, 22, 22)

#create scatterplot of x1 vs. y1
plot(x1, y1, col='red', pch= 19 )

#add scatterplot of x2 vs. y2
points(x2, y2, col='blue', pch= 19 )

#add legend
legend(1, 25, legend=c('Data 1', 'Data 2'), pch=c(19, 19), col=c('red', 'blue')) 

Пример 2. Настройка диаграммы рассеяния

В следующем коде показано, как настроить метки осей, заголовок и размер точек на графике:

#define datasets
x1 = c(1, 3, 6, 11, 19, 20)
y1 = c(7, 10, 11, 12, 18, 25)

x2 = c(1, 3, 8, 13, 17, 19)
y2 = c(9, 15, 18, 21, 22, 22)

#create scatterplot of x1 vs. y1
plot(x1, y1, col='red', pch= 19 , cex= 1.3 ,
 xlab='X', ylab='Y', main='Scatterplot of Two Variables')

#overlay scatterplot of x2 vs. y2
points(x2, y2, col='blue', pch= 19 , cex= 1.3 )

#add legend
legend(1, 25, legend=c('Data 1', 'Data 2'), pch=c(19, 19), col=c('red', 'blue'))

Обратите внимание, что аргумент pch определяет форму точек на графике. Значение pch, равное 19, указывает закрашенный кружок.

Вы можете найти полный список значений pch и соответствующих им форм здесь .

Дополнительные ресурсы

Как пометить точки на диаграмме рассеяния в R
Как создать диаграмму рассеяния с линией регрессии в R
Как использовать функцию джиттера для диаграмм рассеяния в R