Как рассчитать стандартное отклонение в Pandas (с примерами)


Вы можете использовать функцию DataFrame.std() для вычисления стандартного отклонения значений в кадре данных pandas.

На практике можно использовать следующие методы для расчета стандартного отклонения:

Метод 1: рассчитать стандартное отклонение одного столбца

df['column_name'].std( )

Метод 2: вычислить стандартное отклонение нескольких столбцов

df[[ ' column_name1', 'column_name2']].std( )

Метод 3: вычислить стандартное отклонение всех числовых столбцов

df.std( )

Обратите внимание, что функция std() автоматически игнорирует любые значения NaN в DataFrame при вычислении стандартного отклонения.

В следующих примерах показано, как использовать каждый метод со следующими пандами DataFrame:

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
 'points': [25, 12, 15, 14, 19, 23, 25, 29],
 'assists': [5, 7, 7, 9, 12, 9, 9, 4],
 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

 team points assists rebounds
0 A 25 5 11
1 A 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Метод 1: рассчитать стандартное отклонение одного столбца

В следующем коде показано, как рассчитать стандартное отклонение одного столбца в DataFrame:

#calculate standard deviation of 'points' column
df['points'].std( ) 

6.158617655657106

Стандартное отклонение оказывается равным 6,1586 .

Метод 2: вычислить стандартное отклонение нескольких столбцов

В следующем коде показано, как рассчитать стандартное отклонение нескольких столбцов в DataFrame:

#calculate standard deviation of 'points' and 'rebounds' columns
df[['points', 'rebounds']]. std()

points 6.158618
rebounds 2.559994
dtype: float64

Стандартное отклонение столбца «Очки» составляет 6,1586 , а стандартное отклонение столбца «Подборы» — 2,5599 .

Метод 3: вычислить стандартное отклонение всех числовых столбцов

В следующем коде показано, как рассчитать стандартное отклонение каждого числового столбца в DataFrame:

#calculate standard deviation of all numeric columns
df.std()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype: float64

Обратите внимание, что Pandas не рассчитывали стандартное отклонение столбца «команда», поскольку это не числовой столбец.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как рассчитать среднее значение столбцов в Pandas
Как рассчитать медиану столбцов в Pandas
Как рассчитать максимальное значение столбцов в Pandas

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.