Одной из наиболее распространенных метрик, используемых для измерения точности прогноза модели, является MSE , что означает среднеквадратичную ошибку .
Он рассчитывается как:
MSE = (1/n) * Σ(факт – прогноз) 2
куда:
- Σ — причудливый символ, означающий «сумма».
- n – размер выборки
- фактический – фактическое значение данных
- прогноз – прогнозируемое значение данных
Чем ниже значение MSE, тем лучше модель способна точно прогнозировать значения.
Чтобы вычислить MSE в MATLAB, мы можем использовать функцию mse(X, Y) .
В следующем примере показано, как использовать эту функцию на практике.
Пример: как рассчитать MSE в MATLAB
Предположим, у нас есть следующие два массива в MATLAB, которые показывают фактические значения и прогнозируемые значения для некоторой модели:
%create array of actual values and array of predicted values
actual = [34 37 44 47 48 48 46 43 32 27 26 24];
predicted = [37 40 46 44 46 50 45 44 34 30 22 23];
Мы можем использовать функцию mse(X, Y) для вычисления среднеквадратичной ошибки (MSE) между двумя массивами:
%calculate MSE between actual values and predicted values
mse(actual, predicted)
ans = 5.9167
Среднеквадратическая ошибка (MSE) этой модели оказывается равной 5,917 .
Мы интерпретируем это как означающее, что среднеквадратическая разница между предсказанными значениями и фактическими значениями составляет 5,917 .
Мы можем сравнить это значение с MSE, полученным другими моделями, чтобы определить, какая модель является «лучшей».
Модель с наименьшим MSE — это модель, которая лучше всего способна прогнозировать фактические значения набора данных.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать среднеквадратичную ошибку с помощью другого статистического программного обеспечения:
Как рассчитать среднеквадратичную ошибку (MSE) в Excel
Как рассчитать среднеквадратичную ошибку (MSE) в Python
Как рассчитать среднеквадратичную ошибку (MSE) в R