Как вычислить среднее значение столбца в R (с примерами)


Вы можете использовать один из следующих методов для вычисления среднего значения столбца в R:

#calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

В следующих примерах показано, как использовать каждый метод со следующим фреймом данных в R:

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
 points=c(99, 90, 93, 86, 88, 82),
 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

 team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Пример 1. Вычисление среднего значения с использованием имени столбца

В следующем коде показано, как вычислить среднее значение столбца «точки», используя имя столбца:

#calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Среднее значение в столбце «баллы» равно 89,66667 .

Пример 2. Вычисление среднего значения с использованием имени столбца (игнорировать пропущенные значения)

Если мы попытаемся вычислить среднее значение столбца, в котором есть пропущенные значения, в результате мы получим NA :

#attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Мы должны использовать na.rm=TRUE , чтобы игнорировать пропущенные значения при вычислении среднего значения столбца:

#calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Среднее значение в столбце «ассисты» — 32,2 .

Пример 3. Вычисление среднего значения с использованием положения столбца

Следующий код показывает, как вычислить среднее значение столбца в позиции индекса 2:

#calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Среднее значение столбца в позиции индекса 2 (столбец «точки») равно 89,66667 .

Пример 4. Вычисление среднего значения всех числовых столбцов

Следующий код показывает, как вычислить среднее значение всех числовых столбцов во фрейме данных:

#calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

 points assists 
89.66667 32.20000

На выходе отображается среднее значение каждого числового столбца во фрейме данных.

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать другие средние значения в R:

Как рассчитать усеченное среднее в R
Как рассчитать среднее геометрическое в R
Как рассчитать средневзвешенное значение в R

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.