Как использовать fread() в R для более быстрого импорта файлов


Вы можете использовать функцию fread() из пакета data.table в R для быстрого и удобного импорта файлов.

Эта функция использует следующий базовый синтаксис:

library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Было показано, что для больших файлов эта функция работает значительно быстрее, чем такие функции, как read.csv из базы R.

И в большинстве случаев эта функция также может автоматически определять разделители и типы столбцов для импортируемого набора данных.

В следующем примере показано, как использовать эту функцию на практике.

Пример: как использовать fread() для импорта файлов в R

Предположим, у меня есть файл CSV с именем data.csv, сохраненный в следующем месте:

C:\Пользователи\Боб\Рабочий стол\data.csv

И предположим, что файл CSV содержит следующие данные:

team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Я могу использовать функцию fread() из пакета data.table , чтобы импортировать этот файл в мою текущую среду R:

library (data.table)

#import data
df <- fread("C:\\Users\\Bob\\Desktop\\data.csv")

#view data
df

 team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Мы можем успешно импортировать файл CSV с помощью функции fread() .

Примечание.Мы использовали двойную обратную косую черту (\) в пути к файлу, чтобы избежать распространенной ошибки импорта .

Обратите внимание, что нам не нужно было указывать и разделитель, так как функция fread() автоматически определила, что это запятая.

Если мы воспользуемся функцией str() для просмотра структуры фрейма данных, то увидим, что функция fread() также автоматически определяет тип объекта для каждого столбца:

#view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team : chr "'A'" "'B'" "'C'" "'D'" ...
 $ points : int 78 85 93 90 91
 $ assists: int 12 20 23 8 14

Из вывода мы видим:

  • Переменная team — это символ.
  • Переменная points является целым числом.
  • Переменная Asses представляет собой целое число.

В этом примере для простоты мы использовали небольшой фрейм данных (5 строк x 3 столбца), но на практике функция fread() способна быстро и эффективно импортировать фреймы данных с десятками тысяч строк, что делает ее предпочтительным методом импорта для крупномасштабные наборы данных.

Дополнительные ресурсы

В следующих руководствах объясняется, как импортировать определенные типы файлов в R:

Как импортировать файлы Excel в R
Как импортировать файлы TSV в R
Как импортировать Zip-файлы в R
Как импортировать файлы SAS в R
Как импортировать файлы .dta в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.