Вы можете использовать следующий базовый синтаксис для создания pandas DataFrame из строки:
import pandas as pd
import io
df = pd.read_csv (io. StringIO (string_data), sep=" , ")
Этот конкретный синтаксис создает кадр данных pandas, используя значения, содержащиеся в строке с именем string_data .
В следующих примерах показано, как использовать этот синтаксис на практике.
Пример 1: создание DataFrame из строки с разделителями-запятыми
В следующем коде показано, как создать кадр данных pandas из строки, в которой значения в строке разделены запятыми:
import pandas as pd
import io
#define string
string_data="""points, assists, rebounds
5, 15, 22
7, 12, 9
4, 3, 18
2, 5, 10
3, 11, 5
"""
#create pandas DataFrame from string
df = pd.read_csv (io. StringIO (string_data), sep=" , ")
#view DataFrame
print(df)
points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5
Результатом является пандас DataFrame с пятью строками и тремя столбцами.
Пример 2: создание DataFrame из строки с разделителями в виде точек с запятой
В следующем коде показано, как создать кадр данных pandas из строки, в которой значения в строке разделены точкой с запятой:
import pandas as pd
import io
#define string
string_data="""points;assists;rebounds
5;15;22
7;12;9
4;3;18
2;5;10
3;11;5
"""
#create pandas DataFrame from string
df = pd.read_csv (io. StringIO (string_data), sep=" ; ")
#view DataFrame
print(df)
points assists rebounds
0 5 15 22
1 7 12 9
2 4 3 18
3 2 5 10
4 3 11 5
Результатом является пандас DataFrame с пятью строками и тремя столбцами.
Если у вас есть строка с другим разделителем, просто используйте аргумент sep в функции read_csv() , чтобы указать разделитель.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как преобразовать столбцы Pandas DataFrame в строки
Как преобразовать отметку времени в дату и время в pandas
Как преобразовать дату и время в дату в pandas