Как рассчитать среднюю абсолютную ошибку в R


В статистике средняя абсолютная ошибка (MAE) — это способ измерения точности данной модели. Он рассчитывается как:

MAE = (1/n) * Σ|y i – x i |

куда:

  • Σ: греческий символ, означающий «сумма».
  • y i : Наблюдаемое значение для i -го наблюдения
  • x i : Прогнозируемое значение для i -го наблюдения
  • n: общее количество наблюдений

Мы можем вычислить среднюю абсолютную ошибку в R, используя функцию mae(actual, required) из пакета Metrics .

В этом руководстве представлены два примера практического использования этой функции.

Пример 1. Расчет средней абсолютной ошибки между двумя векторами

В следующем коде показано, как вычислить среднюю абсолютную ошибку между вектором наблюдаемых значений и вектором прогнозируемых значений:

library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Средняя абсолютная ошибка (MAE) оказывается равной 1,909 .

Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и предсказанными значениями составляет 1,909.

Пример 2. Расчет средней абсолютной ошибки для регрессионной модели

В следующем коде показано, как подобрать модель регрессии в R, а затем вычислить среднюю абсолютную ошибку между прогнозами, сделанными моделью, и фактическими наблюдаемыми значениями отклика:

library (Metrics)

#create data
df <- data.frame(x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

 x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Средняя абсолютная ошибка (MAE) оказывается равной 1,238 .

Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и предсказанными значениями составляет 1,238.

Как правило, чем ниже значение MAE, тем лучше модель соответствует набору данных. При сравнении двух разных моделей мы можем сравнить MAE каждой модели, чтобы узнать, какая из них лучше подходит для набора данных.

Дополнительные ресурсы

Калькулятор средней абсолютной ошибки
Как рассчитать среднюю абсолютную ошибку в Excel
Как рассчитать среднюю абсолютную ошибку в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.