Вы можете использовать один из следующих методов для вычисления среднего значения столбца в R:
#calculate mean using column name
mean(df$my_column)
#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )
#calculate mean using column position
mean(df[, 1])
#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])
В следующих примерах показано, как использовать каждый метод со следующим фреймом данных в R:
#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
points=c(99, 90, 93, 86, 88, 82),
assists=c(33, 28, 31, 39, NA, 30))
#view data frame
df
team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30
Пример 1. Вычисление среднего значения с использованием имени столбца
В следующем коде показано, как вычислить среднее значение столбца «точки», используя имя столбца:
#calculate mean of 'points' column
mean(df$points)
[1] 89.66667
Среднее значение в столбце «баллы» равно 89,66667 .
Пример 2. Вычисление среднего значения с использованием имени столбца (игнорировать пропущенные значения)
Если мы попытаемся вычислить среднее значение столбца, в котором есть пропущенные значения, в результате мы получим NA :
#attempt to calculate mean of 'assists' column
mean(df$assists)
[1] NA
Мы должны использовать na.rm=TRUE , чтобы игнорировать пропущенные значения при вычислении среднего значения столбца:
#calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )
[1] 32.2
Среднее значение в столбце «ассисты» — 32,2 .
Пример 3. Вычисление среднего значения с использованием положения столбца
Следующий код показывает, как вычислить среднее значение столбца в позиции индекса 2:
#calculate mean of column in index position 2
mean(df[, 2])
[1] 89.66667
Среднее значение столбца в позиции индекса 2 (столбец «точки») равно 89,66667 .
Пример 4. Вычисление среднего значения всех числовых столбцов
Следующий код показывает, как вычислить среднее значение всех числовых столбцов во фрейме данных:
#calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )
points assists
89.66667 32.20000
На выходе отображается среднее значение каждого числового столбца во фрейме данных.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать другие средние значения в R:
Как рассчитать усеченное среднее в R
Как рассчитать среднее геометрическое в R
Как рассчитать средневзвешенное значение в R