Нормализация набора значений данных означает масштабирование значений таким образом, чтобы среднее значение всех значений равнялось 0, а стандартное отклонение равнялось 1.
В этом руководстве объясняется, как нормализовать данные в Google Таблицах.
Пример: как нормализовать данные в Google Sheets
Предположим, у нас есть следующий набор данных в Google Sheets:
Используйте следующие шаги, чтобы нормализовать этот набор значений данных.
Шаг 1: Рассчитайте среднее значение.
Во-первых, мы будем использовать функцию =AVERAGE(диапазон значений) , чтобы найти среднее значение набора данных.
Шаг 2: Найдите стандартное отклонение.
Далее мы будем использовать функцию = СТАНДОТКЛОН (диапазон значений) , чтобы найти стандартное отклонение набора данных.
Шаг 3: нормализуйте значения.
Наконец, мы будем использовать функцию STANDARDIZE(x, mean, standard_dev) для нормализации каждого из значений в наборе данных.
ПРИМЕЧАНИЕ:
Функция СТАНДАРТИЗАЦИЯ использует следующую формулу для нормализации заданного значения данных:
Нормализованное значение = (x – x ) / с
куда:
- х = значение данных
- x = среднее значение набора данных
- s = стандартное отклонение набора данных
На следующем изображении показана формула, используемая для нормализации первого значения в наборе данных:
Как только мы нормализуем первое значение в ячейке B2, мы можем навести указатель мыши на правый нижний угол ячейки B2, пока не появится маленький +.Дважды щелкните + , чтобы скопировать формулу в оставшиеся ячейки:
Теперь каждое значение в наборе данных нормализовано.
Как интерпретировать нормализованные данные
Формула, которую мы использовали для нормализации заданного значения данных x, была следующей:
Нормализованное значение = (x – x ) / с
куда:
- х = значение данных
- x = среднее значение набора данных
- s = стандартное отклонение набора данных
Если конкретная точка данных имеет нормализованное значение больше 0, это означает, что точка данных больше среднего. И наоборот, нормализованное значение меньше 0 указывает на то, что точка данных меньше среднего значения.
В частности, нормализованное значение говорит нам, сколько стандартных отклонений исходной точки данных от среднего. Например, рассмотрим точку данных «12» в нашем исходном наборе данных:
Нормализованное значение для «12» оказалось равным -1,288, которое было рассчитано как:
Нормализованное значение = (х – х ) / с = (12 – 22,267) / 7,968 = -1,288
Это говорит нам о том, что значение «12» на 1,288 стандартных отклонения ниже среднего значения в исходном наборе данных.
Каждое из нормализованных значений в наборе данных может помочь нам понять, насколько близко или далеко конкретное значение данных от среднего. Небольшое нормализованное значение указывает, что значение близко к среднему, в то время как большое нормализованное значение указывает, что значение далеко от среднего.
Дополнительные ресурсы
Как нормализовать данные в Excel
Как нормализовать данные в R