Чтобы нормализовать значения в наборе данных между 0 и 100, вы можете использовать следующую формулу:
z i = (x i – мин(х)) / (макс(х) – мин(х)) * 100
куда:
- z i : i -е нормализованное значение в наборе данных
- x i : i -е значение в наборе данных
- min(x) : минимальное значение в наборе данных.
- max(x): максимальное значение в наборе данных
Например, предположим, что у нас есть следующий набор данных:

Минимальное значение в наборе данных — 12, максимальное — 68.
Чтобы нормализовать первое значение 12 , мы должны применить формулу, которую использовали ранее:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Чтобы нормализовать второе значение 19 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных в диапазоне от 0 до 100:

Как нормализовать данные между любым диапазоном
На самом деле мы можем использовать эту формулу для нормализации набора данных между 0 и любым числом:
z i = (x i – мин(х)) / (макс(х) – мин(х)) * Q
где Q — максимальное число, которое вы хотите для своих нормализованных значений данных.
В предыдущем примере мы выбрали Q равным 100, но мы могли бы легко нормализовать диапазон значений данных от 0 до 1000, выбрав Q равным 1000:
Чтобы нормализовать первое значение 12 , мы должны применить формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Чтобы нормализовать второе значение 19 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7
Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных в диапазоне от 0 до 1000:

Когда нормализовать данные
Иногда мы нормализуем переменные при выполнении некоторого типа анализа, в котором у нас есть несколько переменных, измеренных в разных масштабах, и мы хотим, чтобы каждая из переменных имела одинаковый диапазон.
Это предотвращает чрезмерное влияние одной переменной, особенно если она измеряется в разных единицах (например, если одна переменная измеряется в дюймах, а другая — в ярдах).
Также стоит отметить, что в этом руководстве мы использовали метод, известный как минимальная-максимальная нормализация , для нормализации значений данных.
Двумя наиболее распространенными методами нормализации являются следующие:
1. Мин-макс нормализация
- Цель: Преобразует каждое значение данных в значение от 0 до 100.
- Формула: Новое значение = (значение – мин.) / (макс. – мин.) * 100
2. Средняя нормализация
- Цель: Масштабирует значения таким образом, чтобы среднее значение всех значений было равно 0 и станд. разв. 1.
- Формула: Новое значение = (значение – среднее значение) / (стандартное отклонение)
Дополнительные ресурсы
Как нормализовать данные между 0 и 1
Как нормализовать данные в Excel
Как нормализовать данные в R
Как нормализовать столбцы в Python