График пар — это матрица диаграмм рассеяния , которая позволяет понять попарные отношения между различными переменными в наборе данных.
Самый простой способ создать парный график в Python — использоватьфункцию seaborn.pairplot(df) .
В следующих примерах показано, как использовать эту функцию на практике.
Пример 1: парный график для всех переменных
В следующем коде показано, как создать парный график для каждой числовой переменной в наборе данных Seaborn под названием iris :
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
#define dataset
iris = sns.load_dataset(" iris ")
#create pairs plot for all numeric variables
sns.pairplot (iris)

Способ интерпретации матрицы следующий:
- Распределение каждой переменной показано в виде гистограммы в диагональных прямоугольниках.
- Во всех остальных полях отображается диаграмма рассеяния отношений между каждой парной комбинацией переменных. Например, в поле в нижнем левом углу матрицы отображается диаграмма рассеяния значений дляpetal_width и sepal_length .
Этот единственный график дает нам представление о взаимосвязи между каждой парой переменных в нашем наборе данных.
Пример 2: Парный график для конкретных переменных
Мы также можем указать только определенные переменные для включения в график пар:
sns.pairplot (iris[['sepal_length', 'sepal_width']])

Пример 3: парный график с цветом по категориям
Мы также можем создать парный график, который окрашивает каждую точку на каждом графике на основе некоторой категориальной переменной, используя аргумент hue :
sns.pairplot (iris, hue='species')

Используя аргумент оттенка , мы можем еще лучше понять данные.
Дополнительные ресурсы
Как сделать барплоты с Seaborn
Как сделать тепловые карты с Seaborn
Как добавить название к участкам Seaborn