Часто вас может заинтересовать вычисление суммы одного или нескольких столбцов в кадре данных pandas. К счастью, вы можете легко сделать это в pandas, используя функцию sum() .
В этом руководстве показано несколько примеров использования этой функции.
Пример 1: найти сумму одного столбца
Предположим, у нас есть следующие Pandas DataFrame:
import pandas as pd
import numpy as np
#create DataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})
#view DataFrame
df
rating points assists rebounds
0 90 25 5 NaN
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7
Мы можем найти сумму столбца под названием «баллы», используя следующий синтаксис:
df['points']. sum ()
182
Функция sum() также будет исключать NA по умолчанию. Например, если мы найдем сумму столбца «рикошеты», первое значение «NaN» будет просто исключено из расчета:
df['rebounds']. sum ()
72.0
Пример 2. Найдите сумму нескольких столбцов
Мы можем найти сумму нескольких столбцов, используя следующий синтаксис:
#find sum of points and rebounds columns
df[['rebounds', 'points']]. sum ()
rebounds 72.0
points 182.0
dtype: float64
Пример 3: найти сумму всех столбцов
Мы также можем найти сумму всех столбцов, используя следующий синтаксис:
#find sum of all columns in DataFrame
df.sum ()
rating 853.0
points 182.0
assists 68.0
rebounds 72.0
dtype: float64
Для столбцов, которые не являются числовыми, функция sum() просто не будет вычислять сумму этих столбцов.
Вы можете найти полную документацию по функции sum() здесь .