Часто вас может интересовать только подсчет количества строк в кадре данных pandas, которые соответствуют некоторым критериям.
К счастью, это легко сделать, используя следующий базовый синтаксис:
sum(df.column_name == some_value )
В следующих примерах показано, как использовать этот синтаксис на практике для следующего фрейма данных:
import pandas as pd
#create DataFrame
df = pd.DataFrame({'x': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
'y': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df.head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Пример 1. Подсчет строк, равных некоторому значению
В следующем коде показано, как подсчитать количество строк, в которых переменная x равна 10:
sum(df.x == 10 )
2
В следующем коде показано, как подсчитать количество строк, в которых переменная x равна 10 или переменная y равна 5:
sum((df.x == 10 ) | (df.y == 5 ))
3
В следующем коде показано, как подсчитать количество строк, в которых переменная x не равна 10:
sum(df.x != 10 )
9
Пример 2. Подсчет строк больше или равен некоторому значению
В следующем коде показано, как подсчитать количество строк, где x больше 10:
sum(df.x > 10 )
2
В следующем коде показано, как подсчитать количество строк, где x меньше или равно 7:
sum(df.x <= 7 )
5
Пример 3. Подсчет строк между двумя значениями
В следующем коде показано, как подсчитать количество строк, где x находится в диапазоне от 10 до 20:
sum((df.x >= 5 ) & (df.x <= 10 ))
7
Дополнительные ресурсы
Pandas: как найти разницу между двумя строками
Pandas: как удалить строки, содержащие определенную строку
Pandas: как удалить повторяющиеся строки в DataFrame