Pandas: как заменить значения NaN в сводной таблице нулями
Вы можете использовать аргумент fill_value в pandas, чтобы вместо этого заменить значения NaN в сводной таблице нулями.
Для этого можно использовать следующий базовый синтаксис:
pd.pivot_table(df, values='col1', index='col2', columns='col3', fill_value= 0 )
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: замена значений NaN в сводной таблице нулями
Предположим, у нас есть следующий кадр данных pandas, который содержит информацию о различных баскетболистах:
import pandas as pd
#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
'position': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
'points': [4, 4, 6, 8, 9, 5, 5, 12]})
#view DataFrame
print(df)
team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B F 9
5 B F 5
6 B F 5
7 B F 12
Мы можем использовать следующий код для создания сводной таблицы в pandas, которая показывает среднее значение очков для каждой команды и позиции в DataFrame:
#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position')
#view pivot table
print(df_pivot)
position C F G
team
A 8.0 6.00 4.0
B NaN 7.75 NaN
Обратите внимание, что в сводной таблице есть два значения NaN, потому что в исходном кадре данных нет игроков с позициями C или G в команде B, поэтому обе эти позиции имеют значения NaN в сводной таблице.
Чтобы заполнить эти значения NaN нулями в сводной таблице, мы можем использовать аргумент fill_value :
#create pivot table with zeros instead of NaN values
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
fill_value= 0 )
#view pivot table
print(df_pivot)
position C F G
team
A 8 6.00 4
B 0 7.75 0
Обратите внимание, что каждое из значений NaN из предыдущей сводной таблицы заполнено нулями.
Примечание.Полную документацию по функции pandas pivot_table() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Pandas: как изменить форму DataFrame с длинного на широкий
Pandas: как изменить форму DataFrame с широкого на длинный
Pandas: как группировать и агрегировать по нескольким столбцам