Выравнивание данных означает установку экстремальных выбросов, равных заданному процентилю данных.
Например, 90-процентная винсоризация приравнивает все наблюдения выше 95-го процентиля к значению 95-го процентиля, а все наблюдения меньше 5-го процентиля приравнивают к значению 5-го процентиля.
В этом руководстве представлен пошаговый пример того, как преобразовать набор данных в Excel.
Шаг 1: Создайте данные
Сначала мы создадим следующий набор данных:

Шаг 2: Рассчитайте верхний и нижний процентили
В этом примере мы выполним винсоризацию на 90%. Это означает, что мы установим все значения, превышающие 95-й процентиль, равным 95-му процентилю, а все значения, меньшие 5-го процентиля, приравняем к 5-му процентилю.
Следующие формулы показывают, как найти 5-й и 95-й процентили:

5-й процентиль оказывается равным 12,35 , а 95-й процентиль оказывается равным 92,05 .
Шаг 3: Винсоризируйте данные
Наконец, мы будем использовать следующую формулу для ранжирования данных:

Обратите внимание, что мы просто копируем и вставляем формулу из ячейки F2 в остальные ячейки столбца F.
В этом случае значение 3 было изменено на 12,35 , а значение 98 изменено на 92,05 .
Обратите внимание, что в этом примере мы выполнили 90%-ную винсоризацию, но можно также выполнить 80-процентную винсоризацию, 95-процентную винсоризацию, 99-процентную винсоризацию и т. д., просто вычислив разные верхние и нижние процентили.