Pandas: как проверить, содержит ли столбец строку


Вы можете использовать следующие методы, чтобы проверить, содержит ли столбец pandas DataFrame строку:

Способ 1: проверьте, существует ли точная строка в столбце

(df['col']. eq('exact_string')).any ()

Способ 2: проверьте, существует ли частичная строка в столбце

df['col']. str.contains('partial_string').any ()

Метод 3: подсчет вхождений частичной строки в столбце

df['col']. str.contains('partial_string'). sum ()

В этом руководстве объясняется, как использовать каждый метод на практике со следующим фреймом данных:

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'],
 'conference': ['East', 'East', 'South', 'West', 'West', 'East'],
 'points': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

 team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Пример 1: проверьте, существует ли точная строка в столбце

В следующем коде показано, как проверить, существует ли точная строка «Eas» в столбце конференции в DataFrame:

#check if exact string 'Eas' exists in conference column
(df['conference']. eq('Eas')).any ()

False

Вывод возвращает False , что говорит нам о том, что точная строка «Eas» не существует в столбце конференции в DataFrame.

Пример 2. Проверка наличия в столбце частичной строки

В следующем коде показано, как проверить, существует ли неполная строка «Eas» в столбце конференции в DataFrame:

#check if partial string 'Eas' exists in conference column
df['conference']. str.contains('Eas').any ()

True

Вывод возвращает True , что говорит нам о том, что неполная строка «Eas» существует в столбце конференции в DataFrame.

Пример 3. Подсчет вхождений неполной строки в столбце

В следующем коде показано, как подсчитать, сколько раз неполная строка «Eas» встречается в столбце конференции в DataFrame:

#count occurrences of partial string 'Eas' in conference column
df['conference']. str.contains('East'). sum ()

3

Вывод возвращает 3 , что говорит нам о том, что неполная строка «Eas» встречается 3 раза в столбце конференции в DataFrame.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как удалить строки в Pandas DataFrame на основе условия
Как фильтровать кадр данных Pandas по нескольким условиям
Как использовать фильтр «НЕ В» в Pandas DataFrame

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.