合並具有來自一個數據幀的類似數據的列

Question

我有一個表，有重復的列，我想加入一個單列。 它們共享相同的列名，但我希望將具有相同標題的任何列合並為一個。

我試圖使用merge，concat等等，但沒有運氣。

data = [['a','a','c'],['a','b','d'],['a','c','c']]
df = pd.DataFrame(data,columns=['col1','col2','col1'])
df
co1 col2 col1
a     a    c
a     b    d
a     c    c

我希望從這一點開始有兩列“col1 with a，a，a，c，d，c”和“col2 a，b，c，nan，nan，nan”

Answer 1

首先stack ，然后unstack 。 在我們取消堆疊數據之前，我們需要做更多的工作。

u = df.stack()
(u.to_frame()
  .set_index(u.groupby(u.index).cumcount(), append=True)
  .unstack(1)
  .sort_index(level=1)[0]
  .reset_index(drop=True))

  col1 col2
0    a    a
1    a    b
2    a    c
3    c  NaN
4    d  NaN
5    c  NaN

另一種選擇是groupby ， to_dict和重建。

dct = (df.groupby(df.columns, axis=1)
                          # x.values.ravel().tolist()
         .apply(lambda x: [z for y in x.values for z in y])
         .to_dict())
pd.DataFrame.from_dict(dct, orient='index').T


  col1  col2
0    a     a
1    c     b
2    a     c
3    d  None
4    a  None
5    c  None

Answer 2

melt groupby與concat

d={x : y['value'].reset_index(drop=True) for x,y in df.melt().groupby('variable')}
df=pd.concat(d,1)
df
Out[39]: 
  col1 col2
0    a    a
1    a    b
2    a    c
3    c  NaN
4    d  NaN
5    c  NaN

合並具有來自一個數據幀的類似數據的列

問題描述

2 個解決方案

解決方案1
2 已采納 2019-03-25 19:45:20

解決方案2
1 2019-03-25 19:48:25

合並具有來自一個數據幀的類似數據的列

問題描述

2 個解決方案

解決方案1 2 已采納 2019-03-25 19:45:20

解決方案2 1 2019-03-25 19:48:25

解決方案1
2 已采納 2019-03-25 19:45:20

解決方案2
1 2019-03-25 19:48:25