R: Как найти уникальные значения в столбце


Вы можете использовать функцию unique() в R, чтобы найти уникальные значения в столбце фрейма данных.

В этом руководстве представлено несколько примеров использования этой функции со следующим фреймом данных:

#create data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'C', 'C'),
 points=c(90, 99, 90, 85, 90, 85),
 assists=c(33, 33, 31, 39, 34, 34),
 rebounds=c(30, 28, 24, 24, 28, 28))

#view data frame
df

 team points assists rebounds
1 A 90 33 30
2 A 99 33 28
3 B 90 31 24
4 B 85 39 24
5 C 90 34 28
6 C 85 34 28

Пример 1. Поиск уникальных значений в столбце

Следующий код показывает, как найти уникальные значения в столбце «команда» :

#find unique values in 'team' column
unique(df$team)

[1] "A" "B" "C"

Мы можем использовать аналогичный синтаксис для поиска уникальных значений в столбце «точки»:

#find unique values in 'points' column
unique(df$points)

[1] 90 99 85

Пример 2. Поиск и сортировка уникальных значений в столбце

В следующем коде показано, как найти и отсортировать уникальные значения в столбце «точки» :

#find and sort unique values in 'points' column
sort(unique(df$points))

[1] 85 90 99

Мы также можем отсортировать уникальные значения в порядке убывания:

#find and sort unique values in 'points' column
sort(unique(df$points), decreasing= TRUE )

[1] 99 90 85

Пример 3. Поиск и подсчет уникальных значений в столбце

В следующем коде показано, как найти и подсчитать количество каждого уникального значения в столбце «баллы»:

#find and count unique values in 'points' column
table(df$points)

85 90 99 
 2 3 1 

Из вывода мы видим:

  • Значение 85 встречается 2 раза.
  • Значение 90 встречается 3 раза.
  • Значение 99 встречается 1 раз.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как выполнить функцию СЧЁТЕСЛИ в R
Как найти и подсчитать пропущенные значения в R
Как подсчитать количество вхождений в столбцах в R