Как читать Zip-файлы в R (с примером)


Вы можете использовать следующий базовый синтаксис для чтения ZIP-файла в R:

library (readr)

#import data1.csv located within my_data.zip
df <- read_csv(unzip(" my_data.zip", " data1.csv "))

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: как читать Zip-файлы в R

Предположим, у меня есть ZIP-файл с именем my_data.zip , который содержит следующие три файла CSV:

  • data1.csv
  • data2.csv
  • data3.csv

Предполагая, что мой рабочий каталог содержит этот ZIP-файл, я могу использовать следующий синтаксис для отображения всех файлов, расположенных в my_data.zip :

#display all files in my_data.zip
unzip(" my_data.zip", list = TRUE )

 Name Length Date
1 data1.csv 37 2022-03-10 09:48:00
2 data2.csv 36 2022-03-10 09:49:00
3 data3.csv 34 2022-03-10 10:54:00

Мы можем видеть имена каждого файла, расположенного в my_data.zip, а также их длину и дату их создания.

Затем я могу использовать следующий синтаксис для импорта набора данных с именем data1.csv во фрейм данных в R:

library (readr)

#read data1.csv into data frame
df1 <- read_csv(unzip(" my_data.zip", " data1.csv "))

#view data frame
df1

# A tibble: 4 x 2
 team points

1 A 12
2 B 31
3 C 27
4 D 30

Мы видим, что R успешно импортировал этот файл CSV во фрейм данных.

Примечание.Полную документацию по функции read_csv() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как импортировать другие файлы в R:

Как импортировать файлы CSV в R
Как импортировать CSV из URL в R
Как импортировать файлы Excel в R