Как нормализовать данные в Google Sheets


Нормализация набора значений данных означает масштабирование значений таким образом, чтобы среднее значение всех значений равнялось 0, а стандартное отклонение равнялось 1.

В этом руководстве объясняется, как нормализовать данные в Google Таблицах.

Пример: как нормализовать данные в Google Sheets

Предположим, у нас есть следующий набор данных в Google Sheets:

Используйте следующие шаги, чтобы нормализовать этот набор значений данных.

Шаг 1: Рассчитайте среднее значение.

Во-первых, мы будем использовать функцию =AVERAGE(диапазон значений) , чтобы найти среднее значение набора данных.

Шаг 2: Найдите стандартное отклонение.

Далее мы будем использовать функцию = СТАНДОТКЛОН (диапазон значений) , чтобы найти стандартное отклонение набора данных.

Шаг 3: нормализуйте значения.

Наконец, мы будем использовать функцию STANDARDIZE(x, mean, standard_dev) для нормализации каждого из значений в наборе данных.

ПРИМЕЧАНИЕ:
Функция СТАНДАРТИЗАЦИЯ использует следующую формулу для нормализации заданного значения данных:
Нормализованное значение = (x – x ) / с
куда:
  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

На следующем изображении показана формула, используемая для нормализации первого значения в наборе данных:

Как только мы нормализуем первое значение в ячейке B2, мы можем навести указатель мыши на правый нижний угол ячейки B2, пока не появится маленький +.Дважды щелкните + , чтобы скопировать формулу в оставшиеся ячейки:

Теперь каждое значение в наборе данных нормализовано.

Как интерпретировать нормализованные данные

Формула, которую мы использовали для нормализации заданного значения данных x, была следующей:

Нормализованное значение = (x – x ) / с

куда:

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

Если конкретная точка данных имеет нормализованное значение больше 0, это означает, что точка данных больше среднего. И наоборот, нормализованное значение меньше 0 указывает на то, что точка данных меньше среднего значения.

В частности, нормализованное значение говорит нам, сколько стандартных отклонений исходной точки данных от среднего. Например, рассмотрим точку данных «12» в нашем исходном наборе данных:

Нормализованное значение для «12» оказалось равным -1,288, которое было рассчитано как:

Нормализованное значение = (х – х ) / с = (12 – 22,267) / 7,968 = -1,288

Это говорит нам о том, что значение «12» на 1,288 стандартных отклонения ниже среднего значения в исходном наборе данных.

Каждое из нормализованных значений в наборе данных может помочь нам понять, насколько близко или далеко конкретное значение данных от среднего. Небольшое нормализованное значение указывает, что значение близко к среднему, в то время как большое нормализованное значение указывает, что значение далеко от среднего.

Дополнительные ресурсы

Как нормализовать данные в Excel
Как нормализовать данные в R