繁体   English   中英

使用 Seaborn 绘制多列 pandas DataFrame

[英]Plot multiple columns of pandas DataFrame using Seaborn

假设我有包含列['X_Axis','col_2','col_3',...,'col_n',]

我需要在 X 轴上绘制第一列,然后在 Y 轴上绘制。 仅供参考:所有值都已根据 X 轴进行分组,X 轴值的范围为0-25 ,所有其他列值已标准化为0 - 1的比例。 我希望它在同一个图表上,而不是子图中。

首选:FactorPlot,正态线图。

  • 一些 seaborn 地块将接受宽数据sns.pointplot(data=df, x='X_Axis', y='col_2') ,但不sns.pointplot(data=df, x='X_Axis', y=['col_2', 'col_3']) ,因此最好重塑 DataFrame。
  • 使用pandas.DataFrame.melt将 DataFrame 从宽变长。
    • 将数据框从宽格式转换为长格式是所有 seaborn plots的标准,而不仅仅是所示示例。
  • python 3.8.12pandas 1.3.4matplotlib 3.4.3seaborn 0.11.2

示例数据框

import pandas as pd
import seaborn as sns

df = pd.DataFrame({'X_Axis':[1,3,5,7,10,20],
                   'col_2':[.4,.5,.4,.5,.5,.4],
                   'col_3':[.7,.8,.9,.4,.2,.3],
                   'col_4':[.1,.3,.5,.7,.1,.0],
                   'col_5':[.5,.3,.6,.9,.2,.4]})

# display(df)
   X_Axis  col_2  col_3  col_4  col_5
0       1    0.4    0.7    0.1    0.5
1       3    0.5    0.8    0.3    0.3
2       5    0.4    0.9    0.5    0.6
3       7    0.5    0.4    0.7    0.9
4      10    0.5    0.2    0.1    0.2
5      20    0.4    0.3    0.0    0.4

# convert to long (tidy) form
dfm = df.melt('X_Axis', var_name='cols', value_name='vals')

# display(dfm.head())
   X_Axis   cols  vals
0       1  col_2   0.4
1       3  col_2   0.5
2       5  col_2   0.4
3       7  col_2   0.5
4      10  col_2   0.5

当前绘图方法

catplot图:图形级

使用带有kind=seaborn.catplot (例如kind='point'以重现FactorPlot默认值):

g = sns.catplot(x="X_Axis", y="vals", hue='cols', data=dfm, kind='point')

在此处输入图像描述

pointplot :轴级

sns.pointplot(x="X_Axis", y="vals", hue='cols', data=dfm)

在此处输入图像描述

原来的

factorplot :更名为catplot v0.9.0(2018 年 7 月)

新版本的 seaborn 收到警告:

factorplot函数已重命名为catplot 原始名称将在未来的版本中删除。 请更新您的代码。 请注意, factorplot ( 'point' ) 中的默认kind已更改catplot'strip'

g = sns.factorplot(x="X_Axis", y="vals", hue='cols', data=dfm)

# using pd.melt instead of pd.DataFrame.melt for pandas < 0.20.0
# dfm = pd.melt(df, 'X_Axis', var_name='cols',  value_name='vals')
# g = sns.factorplot(x="X_Axis", y="vals", hue='cols', data=dfm)

图形

除了强大的@jezrael 对于那些来自谷歌的人之外,如果你打算用原始数据框的索引绘制线条,只需执行以下操作:

df = pd.DataFrame({'col_2':[.4,.5,.4,.5,.5,.4],
                   'col_3':[.7,.8,.9,.4,.2,.3],
                   'col_4':[.1,.3,.5,.7,.1,.0],
                   'col_5':[.5,.3,.6,.9,.2,.4]})

# resetting index before melting to save the current index in 'index' column...
df = df.reset_index().melt('index', var_name='cols',  value_name='vals')
g = sns.catplot(x="index", y="vals", hue='cols', data=df, kind='point')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM