Как использовать colClasses для быстрого импорта данных в R

Как использовать colClasses для быстрого импорта данных в R

Вы можете использовать аргумент colClasses при импорте файла в R, чтобы указать классы каждого столбца:

df <- read.csv('my_data.csv',
 colClasses=c('character', 'numeric', 'numeric'))

Преимущество использования colClasses заключается в том, что вы можете импортировать данные намного быстрее, особенно если файлы очень большие.

В следующем примере показано, как использовать этот аргумент на практике.

Пример: использование colClasses при импорте файлов

Предположим, у меня есть файл CSV с именем my_data.csv с тремя столбцами, которые я хотел бы импортировать в R:

Для этого я могу использовать следующий синтаксис:

#import CSV file
df <- read.csv('my_data.csv',
 colClasses=c('character', 'numeric', 'numeric'))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team : chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points : num 91 99 104 103 105 88 89 93 96 99 ...
 $ rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

Обратите внимание, что количество значений в аргументе colClasses должно соответствовать количеству столбцов во фрейме данных.

Например, если вы укажете только одно значение аргумента colClasses , то каждый столбец во фрейме данных будет иметь один и тот же класс:

#import CSV file
df <- read.csv('my_data.csv',
 colClasses=c('character'))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team : chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points : chr "91" "99" "104" "103" ...
 $ rebounds: chr "33" "23" "26" "25" ...

Обратите внимание, что каждый столбец в результирующем фрейме данных имеет «символьный» класс, поскольку мы предоставили только одно значение аргументу colClasses .

Обратите внимание, что вы можете указать следующие потенциальные классы в аргументе colClasses :

  • персонаж : «эй», «там», «мир»
  • комплекс : as.complex(-1), 4i
  • числовое : as.integer(20), 3L
  • целое число : 4, 12, 158
  • логический : ИСТИНА, ЛОЖЬ

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как вручную вводить необработанные данные в R
Как импортировать файлы CSV в R
Как импортировать файлы Excel в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.