Как нормализовать данные между 0 и 1

Как нормализовать данные между 0 и 1

Чтобы нормализовать значения в наборе данных между 0 и 1, вы можете использовать следующую формулу:

z i = (x i – мин(х)) / (макс(х) – мин(х))

куда:

  • z i : i -е нормализованное значение в наборе данных
  • x i : i -е значение в наборе данных
  • min(x) : минимальное значение в наборе данных.
  • max(x): максимальное значение в наборе данных

Например, предположим, что у нас есть следующий набор данных:

Минимальное значение в наборе данных — 13, максимальное — 71.

Чтобы нормализовать первое значение 13 , мы должны применить формулу, которую использовали ранее:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0

Чтобы нормализовать второе значение 16 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

Чтобы нормализовать третье значение 19 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Мы можем использовать эту же формулу, чтобы нормализовать каждое значение в исходном наборе данных между 0 и 1:

Нормализация данных между 0 и 1

При использовании этого метода нормализации следующие утверждения всегда будут истинными:

  • Нормализованное значение для минимального значения в наборе данных всегда будет равно 0.
  • Нормализованное значение максимального значения в наборе данных всегда будет равно 1.
  • Нормализованные значения для всех остальных значений в наборе данных будут находиться в диапазоне от 0 до 1.

Когда нормализовать данные

Часто мы нормализуем переменные при выполнении некоторого типа анализа, в котором у нас есть несколько переменных, измеряемых в разных масштабах, и мы хотим, чтобы каждая из переменных имела одинаковый диапазон.

Это предотвращает чрезмерное влияние одной переменной, особенно если она измеряется в разных единицах (например, если одна переменная измеряется в дюймах, а другая — в ярдах).

Также стоит отметить, что в этом руководстве мы использовали метод, известный как минимальная-максимальная нормализация , для нормализации значений данных.

Двумя наиболее распространенными методами нормализации являются следующие:

1. Мин-макс нормализация

  • Цель: Преобразует каждое значение данных в значение от 0 до 100.
  • Формула: Новое значение = (значение – мин.) / (макс. – мин.) * 100

2. Средняя нормализация

  • Цель: Масштабирует значения таким образом, чтобы среднее значение всех значений было равно 0 и станд. разв. 1.
  • Формула: Новое значение = (значение – среднее значение) / (стандартное отклонение)

Дополнительные ресурсы

В следующих руководствах объясняется, как нормализовать данные с помощью различных статистических программ:

Как нормализовать данные в Excel
Как нормализовать данные в R
Как нормализовать столбцы в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.