Как создать матрицу рассеяния в Pandas (с примерами)


Матрица рассеяния — это именно то, на что это похоже — матрица диаграмм рассеяния.

Этот тип матрицы удобен тем, что позволяет визуализировать взаимосвязь между несколькими переменными в наборе данных одновременно.

Вы можете использовать функцию scatter_matrix() для создания матрицы рассеяния из кадра данных pandas:

pd.plotting.scatter_matrix(df)

В следующих примерах показано, как использовать этот синтаксис на практике со следующими пандами DataFrame:

import pandas as pd
import numpy as np

#make this example reproducible
np.random.seed (0)

#create DataFrame
df = pd.DataFrame({'points ': np.random.randn(1000),
 'assists ': np.random.randn(1000),
 'rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df.head ()

 points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

Пример 1: Базовая матрица рассеяния

Следующий код показывает, как создать базовую матрицу рассеяния:

pd.plotting.scatter_matrix(df)

Пример 2: Матрица рассеяния для определенных столбцов

В следующем коде показано, как создать матрицу рассеяния только для первых двух столбцов в DataFrame:

pd.plotting.scatter_matrix(df.iloc [:, 0:2])

Пример 3: Матрица рассеивания с пользовательскими цветами и ячейками

В следующем коде показано, как создать матрицу рассеяния с пользовательскими цветами и определенным количеством интервалов для гистограмм:

pd.plotting.scatter_matrix(df, color='red', hist_kwds={' bins ': 30 , 'color':' red '})

Пример 4: Матрица рассеяния с графиком KDE

В следующем коде показано, как создать матрицу рассеяния с графиком оценки плотности ядра вдоль диагоналей матрицы вместо гистограммы:

pd.plotting.scatter_matrix(df, diagonal='kde')

Полную онлайн-документацию по функции scatter_matrix() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как создавать другие распространенные диаграммы в Python:

Как создавать тепловые карты в Python
Как создать кривую нормального распределения в Python
Как создать график Ogive в Python