Pandas

Pandas: как найти уникальные значения в столбце

В: Pandas

Самый простой способ получить список уникальных значений в столбце pandas DataFrame — использовать функцию unique() .

В этом руководстве представлено несколько примеров использования этой функции со следующими пандами DataFrame:

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'],
 'conference': ['East', 'East', 'East', 'West', 'West', 'East'],
 'points': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

 team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

Найти уникальные значения в одном столбце

Следующий код показывает, как найти уникальные значения в одном столбце DataFrame:

df.team.unique ()

array(['A', 'B', 'C'], dtype=object)

Мы видим, что уникальные значения в столбце команды включают «A», «B» и «C».

Найти уникальные значения во всех столбцах

Следующий код показывает, как найти уникальные значения во всех столбцах DataFrame:

for col in df:
 print(df[col]. unique ())

['A' 'B' 'C']
['East' 'West']
[11 8 10 6 5]

Поиск и сортировка уникальных значений в столбце

Следующий код показывает, как найти и отсортировать уникальные значения в одном столбце DataFrame:

#find unique points values
points = df.points.unique ()

#sort values smallest to largest
points. sort ()

#display sorted values
points

array([ 5, 6, 8, 10, 11])

Найти и подсчитать уникальные значения в столбце

В следующем коде показано, как найти и подсчитать появление уникальных значений в одном столбце DataFrame:

df.team.value_counts ()

A 3
B 2
C 1
Name: team, dtype: int64

Дополнительные ресурсы

Как выбрать уникальные строки в Pandas DataFrame
Как найти уникальные значения в нескольких столбцах в Pandas

Еще от кодкамп
Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.