使用相同的Id，pandas從多個列表創建多個行

Question

我有一個像這樣的示例數據框，Column： ID和Main

ID,Main
0,[30 115 266 38;662 99 1199 43] [511 133 25 47] [664 162 49 22]

如何使用pandas使我的數據幀如下所示

預期產出

ID,Main
0,30 115 266 38
0,662 99 1199 43
0,511 133 25 47
0,664 162 49 22

Answer 1

首先replace ; by ][然后通過findall為Series list s提取[]之間的值。

最后創建DataFrame ，通過stack重新DataFrame ，並通過reset_index清除一些數據：

s = df['Main'].fillna('').str.replace(';','][').str.findall('\[(.*?)\]')
df = (pd.DataFrame(s.values.tolist(), index=s.index)
        .stack()
        .reset_index(level=1, drop=True)
        .reset_index())
df.columns = ['ID','Main']
print (df)
   ID            Main
0   0   30 115 266 38
1   0  662 99 1199 43
2   0   511 133 25 47
3   0   664 162 49 22

Series另一個解決方案

s = df['Main'].fillna('').str.strip('[]').str.split(';|\]\s+\[')

使用相同的Id，pandas從多個列表創建多個行

問題描述

1 個解決方案

解決方案1
4 已采納 2018-08-17 11:46:23

使用相同的Id，pandas從多個列表創建多個行

問題描述

1 個解決方案

解決方案1 4 已采納 2018-08-17 11:46:23

解決方案1
4 已采納 2018-08-17 11:46:23