Как сделать диаграмму рассеяния из фрейма данных Pandas


Есть два способа создать диаграмму рассеяния, используя данные из pandas DataFrame:

1. Используйте pandas.DataFrame.plot.scatter

Один из способов создать диаграмму рассеяния — использовать встроенную функцию Pandas plot.scatter() :

import pandas as pd

df.plot.scatter (x = 'x_column_name', y = 'y_columnn_name')

2. Используйте matplotlib.pyplot.scatter

Другой способ создать диаграмму рассеивания — использовать функцию Matplotlib pyplot.scatter() :

import matplotlib.pyplot as plt

plt.scatter (df.x, df.y)

В этом руководстве приведены примеры использования каждого из этих методов.

Пример 1: использование панд

В следующем коде показано, как использовать функцию plot.scatter() для создания простой диаграммы рассеяния:

import pandas as pd

#create DataFrame
df = pd.DataFrame({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15],
 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]})

#create scatterplot
df.plot.scatter (x='x', y='y')

Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:

df.plot.scatter (x='x', y='y', s= 60 , c='green') 

Пример 2: Используйте Matplotlib

В следующем коде показано, как использовать функцию pyplot.scatter() для создания диаграммы рассеяния:

import pandas as pd
import matplotlib.pyplot as plt

#create DataFrame
df = pd.DataFrame({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15],
 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]})

#create scatterplot
plt.scatter (df.x, df.y)

Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:

plt.scatter (df.x, df.y, s= 60 , c='purple') 

Вы можете найти больше руководств по Python здесь .