[英]Pandas groupby on two column and create new column in excel based on result
我有 excel 文件,我正在 jupyter 中讀取。
It has three column: 1) Webinar ID : (66 unique value) 2) Email : email id of participants (which can log out in session and join again so duplicate email id for same webinar id) 3) Time in session (minutes) : session 中的參與者,因為他可能會注銷並再次登錄,所以有多個條目。
使用的代碼: data_group = data.groupby(['Webinar ID', 'Email'])
data_group['Session 中的時間(分鍾)'].sum()
我想在 excel 中創建新列,並將時間總和存儲在 Session(分鍾)信息中 -網絡研討會 ID 和 Email
謝謝!!
IIUC,您希望創建一個新列,其中包含每個網絡研討會組和 email 的時間總和。
讓我們將groupby
與transform
一起使用:
data['Sum Session Minutes'] = (data.groupby(['Webinar ID','Email'])['Time in Session (minutes)']
.transform('sum'))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.