簡體   English   中英

如何加入pandas數據幀,以便seaborn boxplot或violinplot可以使用列作為色調?

[英]How to join pandas dataframe so that seaborn boxplot or violinplot can use a column as hue?

我有一個包含多列的數據框,我可以輕松地使用seaborn在boxplot(或小提琴圖等)中繪制它,如下所示:

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
df1 = pd.DataFrame.from_dict(data1)
sns.boxplot(data=df1)

在此輸入圖像描述

我現在需要的是將這個數據框與另一個數據框合並,這樣我就可以在一個箱形圖中繪制它們,就像在這里一樣: http//seaborn.pydata.org/examples/grouped_boxplot.html

我試過添加一個列並連接。 結果似乎沒問題

data1 = {'p0':[1.,2.,5,0.], 'p1':[2., 1.,1,3], 'p2':[3., 3.,2., 4.]}
data2 = {'p0':[3.,1.,5,1.], 'p1':[3., 2.,3,3], 'p2':[1., 2.,2., 5.]}
df1 = pd.DataFrame.from_dict(data1)
df1['method'] = 'A'
df2 = pd.DataFrame.from_dict(data2)
df2['method'] = 'B'
df_all = pd.concat([df1,df2])
sns.boxplot(data=df_all)

這可行,但它將方法A和B中的數據匯總在一起。但是這會失敗:

sns.boxplot(data=df_all, hue='method')

因為我需要指定x和y。 如果我將x指定為x=['p0', 'p1', 'p2'] ,則將3列進行平均。 所以我想我可以用不同的方式合並數據幀,這樣它的表示就很簡單了。

我認為這里以簡單的方式工作將需要一個像這樣的數據幀:

價值方法

1.0 A p0

2.1 A p0

3.0 A p1

1.3 B p0

4.3 B p1

那么你可以用sns.boxplot(data=df, hue='method', x='p', y='value')得到你想要的sns.boxplot(data=df, hue='method', x='p', y='value')

我正在研究如何將df1和df2輕松地合並到像這樣的數據框架中,但我不是真正的熊貓專家。

編輯:想出來,需要使用melt方法:

df3 = pd.concat([df1.melt(id_vars='method', var_name='p'),
                 df2.melt(id_vars='method', var_name='p')],
                 ignore_index=True)
sns.boxplot(x='p', y='value', hue='method', data=df3)

在此輸入圖像描述

sns.boxplot(data=df1, hue='method')

只包含第一個數據幀( df1 )中的信息。 如果您只使用df1 ,則df1["method"]中的所有行都具有相同的值(“A”),因此所有行的顏色都相同。

一個選項是連接兩個數據幀; 例如:

result = pd.concat([df1, df2])
sns.boxplot(data=result, hue='method')

更新的問題:

如果傳遞data=pandas.Dataframe()作為參數,則應使用data=pandas.Dataframe()的列名定義xy參數。

試試這個:

fig,ax = plt.subplots(1,2,sharey=True)
for i,g in enumerate(df_all.groupby(by=df_all.method)):
    sns.boxplot(g[1],ax=ax[i])
    ax[i].set_title(g[0])

結果:

在此輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM