Как нормализовать данные от 0 до 100

Как нормализовать данные от 0 до 100

Чтобы нормализовать значения в наборе данных между 0 и 100, вы можете использовать следующую формулу:

z i = (x i – мин(х)) / (макс(х) – мин(х)) * 100

куда:

  • z i : i -е нормализованное значение в наборе данных
  • x i : i -е значение в наборе данных
  • min(x) : минимальное значение в наборе данных.
  • max(x): максимальное значение в наборе данных

Например, предположим, что у нас есть следующий набор данных:

Минимальное значение в наборе данных — 12, максимальное — 68.

Чтобы нормализовать первое значение 12 , мы должны применить формулу, которую использовали ранее:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

Чтобы нормализовать второе значение 19 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5

Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07

Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных в диапазоне от 0 до 100:

Нормализация данных от 0 до 100

Как нормализовать данные между любым диапазоном

На самом деле мы можем использовать эту формулу для нормализации набора данных между 0 и любым числом:

z i = (x i – мин(х)) / (макс(х) – мин(х)) * Q

где Q — максимальное число, которое вы хотите для своих нормализованных значений данных.

В предыдущем примере мы выбрали Q равным 100, но мы могли бы легко нормализовать диапазон значений данных от 0 до 1000, выбрав Q равным 1000:

Чтобы нормализовать первое значение 12 , мы должны применить формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

Чтобы нормализовать второе значение 19 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7

Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных в диапазоне от 0 до 1000:

Нормализация данных между двумя числами

Когда нормализовать данные

Иногда мы нормализуем переменные при выполнении некоторого типа анализа, в котором у нас есть несколько переменных, измеренных в разных масштабах, и мы хотим, чтобы каждая из переменных имела одинаковый диапазон.

Это предотвращает чрезмерное влияние одной переменной, особенно если она измеряется в разных единицах (например, если одна переменная измеряется в дюймах, а другая — в ярдах).

Также стоит отметить, что в этом руководстве мы использовали метод, известный как минимальная-максимальная нормализация , для нормализации значений данных.

Двумя наиболее распространенными методами нормализации являются следующие:

1. Мин-макс нормализация

  • Цель: Преобразует каждое значение данных в значение от 0 до 100.
  • Формула: Новое значение = (значение – мин.) / (макс. – мин.) * 100

2. Средняя нормализация

  • Цель: Масштабирует значения таким образом, чтобы среднее значение всех значений было равно 0 и станд. разв. 1.
  • Формула: Новое значение = (значение – среднее значение) / (стандартное отклонение)

Дополнительные ресурсы

Как нормализовать данные между 0 и 1
Как нормализовать данные в Excel
Как нормализовать данные в R
Как нормализовать столбцы в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.