Как рассчитать среднее абсолютное отклонение в R


Среднее абсолютное отклонение измеряет разброс наблюдений в наборе данных.

Это особенно полезная метрика, поскольку на нее меньше влияют выбросы, чем на другие меры дисперсии , такие как стандартное отклонение и дисперсия.

Формула для расчета медианного абсолютного отклонения, часто обозначаемая аббревиатурой MAD, выглядит следующим образом:

MAD = медиана (|x i – x m |)

куда:

  • x i : i -е значение в наборе данных
  • x m : среднее значение в наборе данных

В следующих примерах показано, как вычислить среднее абсолютное отклонение R с помощью встроенной функции mad() .

Пример 1: Расчет MAD для вектора

Следующий код показывает, как вычислить среднее абсолютное отклонение для одного вектора в R:

#define data
data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24)

#calculate MAD
mad(data)

[1] 11.1195

Среднее абсолютное отклонение для набора данных оказывается равным 11,1195 .

Пример 2: Расчет MAD для столбца во фрейме данных

Следующий код показывает, как вычислить MAD для одного столбца во фрейме данных:

#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
 y = c(3, 4, 6, 8, 8, 9, 19),
 z = c(2, 2, 2, 3, 5, 8, 11))

#calculate MAD for column *y* in data frame
mad(data$y)

[1] 2.9652

Среднее абсолютное отклонение для столбца y оказывается равным 2,9652 .

Пример 3. Расчет MAD для нескольких столбцов во фрейме данных

В следующем коде показано, как вычислить MAD для нескольких столбцов во фрейме данных с помощью функции sapply() :

#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
 y = c(3, 4, 6, 8, 8, 9, 19),
 z = c(2, 2, 2, 3, 5, 8, 11))

#calculate MAD for all columns in data frame
sapply(data, mad)

 x y z 
2.9652 2.9652 1.4826

Среднее абсолютное отклонение составляет 2,9652 для столбца x, 2,9652 для столбца y и 1,4826 для столбца z.

Связанный: Руководство по apply(), lapply(), sapply() и tapply() в R

Дополнительные ресурсы

Как рассчитать MAPE в R
Как рассчитать MSE в R
Как рассчитать RMSE в R