Как усреднить по столбцам в R (с примерами)


Часто вам может понадобиться вычислить среднее значение нескольких столбцов в R. К счастью, это легко сделать с помощью функции rowMeans() .

В этом руководстве показано несколько примеров использования этой функции на практике.

Пример 1. Найдите среднее значение по всем столбцам

В следующем коде показано, как вычислить среднее значение каждой строки по всем столбцам во фрейме данных:

#create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
 var2 = c(5, 5, 7, 8, 9),
 var3 = c(2, 7, 9, 9, 7))

#view data frame
data

 var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Способ интерпретации вывода следующий:

  • Среднее значение в первой строке равно 2,333 .
  • Среднее значение во второй строке равно 6 .
  • Среднее значение в третьей строке равно 6 .
  • Среднее значение в четвертой строке равно 6,333 .
  • Среднее значение в пятой строке равно 7 .

Вы также можете назначить эти средние значения строк новой переменной во фрейме данных:

#assign row averages to new variable named *row_mean*
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

 var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Пример 2. Найдите среднее значение по определенным столбцам

Также можно найти среднее значение только для определенных столбцов во фрейме данных. Например, следующий код показывает, как вычислить средние значения строк только для первых двух столбцов:

#find row averages across first two columns
data$new <- rowMeans(data[ , c(1,2)], na.rm= TRUE )

#view data frame
data

 var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Мы видим, что:

  • Среднее значение в первой строке первых двух столбцов равно 2,5 .
  • Среднее значение во второй строке первых двух столбцов равно 5 .

И так далее.

Вы можете использовать аналогичный синтаксис, чтобы найти средние значения строк для любого набора столбцов. Например, следующий код показывает, как вычислить средние значения строк только для первого и третьего столбцов:

#find row averages across first and third columns
data$new <- rowMeans(data[ , c(1,3)], na.rm= TRUE )

#view data frame
data

 var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Мы видим, что:

  • Среднее значение в первой строке по первому и третьему столбцам равно 1 .
  • Среднее значение во второй строке по первому и третьему столбцам равно 7 .

И так далее.

Вы можете найти больше руководств по R здесь .

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.