Как создать матрицу рассеяния в Pandas (с примерами)

Как создать матрицу рассеяния в Pandas (с примерами)

Матрица рассеяния — это именно то, на что это похоже — матрица диаграмм рассеяния.

Этот тип матрицы удобен тем, что позволяет визуализировать взаимосвязь между несколькими переменными в наборе данных одновременно.

Вы можете использовать функцию scatter_matrix() для создания матрицы рассеяния из кадра данных pandas:

pd.plotting.scatter_matrix(df)

В следующих примерах показано, как использовать этот синтаксис на практике со следующими пандами DataFrame:

import pandas as pd
import numpy as np

#make this example reproducible
np.random.seed (0)

#create DataFrame
df = pd.DataFrame({'points ': np.random.randn(1000),
 'assists ': np.random.randn(1000),
 'rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df.head ()

 points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

Пример 1: Базовая матрица рассеяния

Следующий код показывает, как создать базовую матрицу рассеяния:

pd.plotting.scatter_matrix(df)
матрица рассеяния в pandas

Пример 2: Матрица рассеяния для определенных столбцов

В следующем коде показано, как создать матрицу рассеяния только для первых двух столбцов в DataFrame:

pd.plotting.scatter_matrix(df.iloc [:, 0:2])

Пример 3: Матрица рассеивания с пользовательскими цветами и ячейками

В следующем коде показано, как создать матрицу рассеяния с пользовательскими цветами и определенным количеством интервалов для гистограмм:

pd.plotting.scatter_matrix(df, color='red', hist_kwds={' bins ': 30 , 'color':' red '})
Матрица рассеяния панд с пользовательским цветом

Пример 4: Матрица рассеяния с графиком KDE

В следующем коде показано, как создать матрицу рассеяния с графиком оценки плотности ядра вдоль диагоналей матрицы вместо гистограммы:

pd.plotting.scatter_matrix(df, diagonal='kde')

Полную онлайн-документацию по функции scatter_matrix() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как создавать другие распространенные диаграммы в Python:

Как создавать тепловые карты в Python
Как создать кривую нормального распределения в Python
Как создать график Ogive в Python

Замечательно! Вы успешно подписались.
Добро пожаловать обратно! Вы успешно вошли
Вы успешно подписались на кодкамп.
Срок действия вашей ссылки истек.
Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.
Успех! Ваша платежная информация обновлена.
Ваша платежная информация не была обновлена.