Вы можете использовать следующий синтаксис для добавления начальных нулей к строкам в кадре данных pandas:
df['ID'] = df['ID'].apply('{:0>7} '. format )
Эта конкретная формула добавляет столько начальных нулей, сколько необходимо, к строкам в столбце с заголовком «ID», пока каждая строка не будет иметь длину 7 .
Не стесняйтесь заменить 7 другим значением, чтобы добавить другое количество начальных нулей.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: добавление начальных нулей к строкам в Pandas
Предположим, у нас есть следующий кадр данных pandas, который содержит информацию о продажах и возвратах для различных магазинов:
import pandas as pd
#create DataFrame
df = pd.DataFrame({'ID': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
'sales': [18, 12, 27, 30, 45, 23],
'refunds': [1, 3, 3, 2, 5, 0]})
#view DataFrame
print(df)
ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0
Обратите внимание, что длины строк в столбце «ID» не все равны.
Однако мы видим, что самая длинная строка состоит из 7 символов.
Мы можем использовать следующий синтаксис для добавления начальных нулей к строкам в столбце «ID», чтобы каждая строка имела длину 7 :
#add leading zeros to 'ID' column
df['ID'] = df['ID'].apply('{:0>7} '. format )
#view updated DataFrame
print(df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
Обратите внимание, что к строкам в столбце «ID» добавлены начальные нули, так что теперь каждая строка имеет одинаковую длину.
Примечание.Полную документацию по функции применения в pandas можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как вменить пропущенные значения в Pandas
Как подсчитать пропущенные значения в Pandas
Как заполнить значения NaN средним значением в Pandas