Как вручную вводить необработанные данные в R


R — один из самых популярных языков программирования для работы с данными. Но прежде чем мы сможем работать с данными, мы должны получить данные в R!

Если у вас уже есть данные, расположенные в файле CSV или файле Excel, вы можете выполнить шаги, описанные в этих руководствах, чтобы импортировать их в R:

Однако иногда вам может потребоваться вручную ввести необработанные данные в R. В этом руководстве объясняется, как это сделать.

Введите вектор

Мы можем использовать следующий синтаксис для ввода одного вектора числовых значений в R:

#create vector of numeric values
numeric_values <- c(1, 3, 5, 8, 9)

#display class of vector
class(numeric_values)

[1] "numeric"
#display vector of numeric values
numeric_values

[1] 1 3 5 8 9

#return second element in vector
numeric_values[4]

[1] 8

Мы можем использовать тот же синтаксис для ввода вектора значений символов:

#create vector of character values
char_values <- c("Bob", "Mike", "Tony", "Andy")

#display class of vector
class(char_values)

[1] "character"

Введите фрейм данных

Мы можем использовать следующий синтаксис для ввода фрейма данных значений в R:

#create data frame
df <- data.frame(team=c("A", "A", "B", "B", "C"),
 points=c(12, 15, 17, 24, 27),
 assists=c(4, 7, 7, 8, 12))

#display data frame
df

 team points assists
1 A 12 4
2 A 15 7
3 B 17 7
4 B 24 8
5 C 27 12

#display class of df
class(df)

[1] "data.frame"

#return value in fourth row and third column
df[4, 3]

[1] 8

Введите матрицу

Мы можем использовать следующий синтаксис для ввода матрицы значений в R:

#create matrix with two columns and five rows
points=c(12, 15, 17, 24, 27)
assists=c(4, 7, 7, 8, 12)

#column bind the two vectors together to create a matrix
mat <- cbind(points, assists)

#display matrix
mat

 points assists
[1,] 12 4
[2,] 15 7
[3,] 17 7
[4,] 24 8
[5,] 27 12

#display class of mat
class(mat)

[1] "matrix"

#return value in fourth row and second column
mat[4, 2]

assists 
 8

Примечание. Для матрицы требуется, чтобы все столбцы были одного типа, в отличие от фреймов данных.

Вы можете найти больше руководств по R здесь .