[英]How to calculate ratio with groupby
我有一個數據集,如下所示:
New_ID loanid RPC RPC_PERIOD PhoneNumber
0 1282908.0 10321436 0 0 9.055100e+10
1 1282908.0 10321436 0 0 9.059893e+10
2 1282908.0 10321436 0 0 9.570575e+12
3 1282908.0 10321436 0 0 9.057456e+10
4 1282908.0 10321436 0 0 9.570551e+12
變量 RPC 是二進制 (1, 0)。
我想通過“New_ID”對數據框進行分組,添加帶有 RPC 總數的新列,總 RPC(意味着計算 RPC=1)對這兩個屬性進行比率。
我試過了:
df['picked_up'] = df.groupby(by='New_ID')['RPC'].sum()
df['tries'] = df.groupby(by='New_ID')['RPC'].count()
df['ratio'] = df['picked_up'] / df['tries']
幫助將不勝感激。
這將起作用:
df['sum'] = df.groupby('New_ID')['RPC'].transform(sum)
df['total'] = df.groupby('New_ID')['RPC'].transform('count')
df['ratio'] = df.groupby('New_ID')['RPC'].transform(mean)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.