Стандартное отклонение — один из наиболее распространенных способов измерения разброса набора данных.
Он рассчитывается как:
Стандартное отклонение = √( Σ(xi – x ) 2 / n)
Альтернативным способом измерения разброса наблюдений в наборе данных является среднее абсолютное отклонение .
Он рассчитывается как:
Среднее абсолютное отклонение = Σ|x i – x | / п
В этом руководстве объясняются различия между этими двумя показателями, а также приводятся примеры расчета каждого из них.
Сходства и различия
Как следует из названий, и стандартное отклонение, и среднее абсолютное отклонение пытаются количественно определить типичное отклонение наблюдений от среднего значения в данном наборе данных.
Однако метод , используемый каждой метрикой, отличается.
Стандартное отклонение
Стандартное отклонение находит квадрат разницы между каждым наблюдением и средним значением набора данных. Затем он берет среднее значение этих квадратов разностей и извлекает квадратный корень.
Это оставляет нам число, которое представляет собой «стандартное» или типичное отклонение наблюдения от среднего значения.
Среднее абсолютное отклонение
И наоборот, среднее абсолютное отклонение находит абсолютное отклонение между каждым наблюдением и средним значением набора данных. Затем он находит среднее значение этих отклонений.
Это оставляет нам число, которое представляет собой среднее отклонение наблюдений от среднего.
Поскольку стандартное отклонение находит квадраты разностей, оно всегда будет больше или равно среднему абсолютному отклонению.
Когда присутствуют экстремальные выбросы, стандартное отклонение будет значительно больше, чем среднее абсолютное отклонение. Следующий пример иллюстрирует это положение.
Пример: среднее абсолютное отклонение в сравнении со стандартным отклонением
Предположим, у нас есть следующий набор данных из 8 значений:
Среднее значение равно 11 .
Таким образом, мы рассчитали бы среднее абсолютное отклонение как:
Среднее абсолютное отклонение = (|3-11| + |5-11| + |6-11| + |8-11| + |11-11| + |14-11| + |17-11| + |24- 11|)/8 = 5,5 .
И мы рассчитали бы стандартное отклонение как:
Стандартное отклонение = √((3-11) 2 + (5-11) 2 + (6-11) 2 + (8-11) 2 + (11-11) 2 + (14-11) 2 + (17- 11) 2 + (24-11) 2 )/8) = 6,595 .
Как упоминалось ранее, стандартное отклонение всегда будет равно среднему абсолютному отклонению или больше его.
Однако разница между стандартным отклонением и средним абсолютным отклонением будет особенно велика, если в наборе данных есть экстремальные выбросы.
Например, рассмотрим следующий набор данных с экстремальным выбросом для последнего значения:
Оказывается, стандартное отклонение для этого набора данных составляет 63,27 , а среднее абсолютное отклонение — 41,75 .
Экстремальный выброс приводит к тому, что стандартное отклонение намного превышает среднее абсолютное отклонение.