Есть два способа создать диаграмму рассеяния, используя данные из pandas DataFrame:
1. Используйте pandas.DataFrame.plot.scatter
Один из способов создать диаграмму рассеяния — использовать встроенную функцию Pandas plot.scatter() :
import pandas as pd
df.plot.scatter (x = 'x_column_name', y = 'y_columnn_name')
2. Используйте matplotlib.pyplot.scatter
Другой способ создать диаграмму рассеивания — использовать функцию Matplotlib pyplot.scatter() :
import matplotlib.pyplot as plt
plt.scatter (df.x, df.y)
В этом руководстве приведены примеры использования каждого из этих методов.
Пример 1: использование панд
В следующем коде показано, как использовать функцию plot.scatter() для создания простой диаграммы рассеяния:
import pandas as pd
#create DataFrame
df = pd.DataFrame({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15],
'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]})
#create scatterplot
df.plot.scatter (x='x', y='y')
Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:
df.plot.scatter (x='x', y='y', s= 60 , c='green')
Пример 2: Используйте Matplotlib
В следующем коде показано, как использовать функцию pyplot.scatter() для создания диаграммы рассеяния:
import pandas as pd
import matplotlib.pyplot as plt
#create DataFrame
df = pd.DataFrame({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15],
'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]})
#create scatterplot
plt.scatter (df.x, df.y)
Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:
plt.scatter (df.x, df.y, s= 60 , c='purple')
Вы можете найти больше руководств по Python здесь .