通過軸0上的單列合並pandas DataFrame

Question

我想結合幾個這樣的pandas DataFrames ：（所有輸入都有第一列P加上唯一命名的第二列。）

df_b3 = pd.DataFrame({'P':  ['l1','l3'],
                      'b3': ['+','+']},
                      index=[0,1])
df_ka = pd.DataFrame({'P':  ['l1','l2','l3'],
                      'ka': ['+','+','+']},
                      index=[0,1,2])
df_kb = pd.DataFrame({'P':  ['l2','l3'],
                      'kb': ['+','+']},
                      index=[0,1])

輸出應該是這樣的：（它應該具有與輸入一樣多的列，再加上P一列，任何輸入的P列中的每個值都應該只有一行。）

       P   b3   ka   kb
0  l1    +    +  NaN
1  l2  NaN    +    +
2  l3    +    +    +

一個簡單的pd.concat([df_b3, df_ka, df_kb])給我太多行和NaN ：

       P   b3   ka   kb
0  l1    +  NaN  NaN
0  l1  NaN    +  NaN
1  l2  NaN    +  NaN
0  l2  NaN  NaN    +
1  l3    +  NaN  NaN
2  l3  NaN    +  NaN
1  l3  NaN  NaN    +

熊貓如何最好地做到這一點？

Answer 1

我認為需要set_index每個DataFrame由對齊P列concat ：

dfs = [df_b3, df_ka, df_kb]
dfs1 = [x.set_index('P') for x in dfs]
#same as
#dfs1 = [df_b3.set_index('P'), df_ka.set_index('P'), df_kb.set_index('P')]
df = pd.concat(dfs1, axis=1).rename_axis('P').reset_index()
print (df)
    P   b3 ka   kb
0  l1    +  +  NaN
1  l2  NaN  +    +
2  l3    +  +    +

Answer 2

您可以使用加入

df_b3.join(df_ka, on='P')

不要忘記選擇其他選項，例如“內部”，“外部” ...等。

通過軸0上的單列合並pandas DataFrame

問題描述

2 個解決方案

解決方案1
4 已采納 2018-03-29 13:06:49

解決方案2
0 2018-03-29 13:07:10

通過軸0上的單列合並pandas DataFrame

問題描述

2 個解決方案

解決方案1 4 已采納 2018-03-29 13:06:49

解決方案2 0 2018-03-29 13:07:10

解決方案1
4 已采納 2018-03-29 13:06:49

解決方案2
0 2018-03-29 13:07:10