Pandas數據幀分組值

Question

我有像這樣的熊貓數據框，

dd = pd.DataFrame(
{'name': ['abc','bcd','abc'],
 'seconds': [75,77,90],
})

我需要將seconds列合並為具有相同名稱的行的單個列表。

我能夠使用for循環，

names= list(set(dd['name']))
counter=[]
for a in names:
    counter.append(list(dd[dd['name'] == a]['seconds']))
end
seconds_list = pd.DataFrame(
{'name': names,
'seconds': counter,
})

輸出：

但這需要花費大量時間在大數據幀上。 沒有for循環的任何簡單方法來實現這一點？

謝謝！

Answer 1

使用groupby和apply list ：

df = dd.groupby('name')['seconds'].apply(list).reset_index()
print (df)

  name   seconds
0  abc  [75, 90]
1  bcd      [77]

Answer 2

使用groupby ， agg和tolist ：

 dd.groupby('name')['seconds'].agg(lambda x: x.tolist()).reset_index(name='seconds')

輸出：

  name   seconds
0  abc  [75, 90]
1  bcd      [77]

Pandas數據幀分組值

問題描述

2 個解決方案

解決方案1
2 已采納 2017-09-06 13:59:35

解決方案2
1 2017-09-06 14:05:31

Pandas數據幀分組值

問題描述

2 個解決方案

解決方案1 2 已采納 2017-09-06 13:59:35

解決方案2 1 2017-09-06 14:05:31

解決方案1
2 已采納 2017-09-06 13:59:35

解決方案2
1 2017-09-06 14:05:31