[英]divide two columns group by two columns
我想将两列收入来自 df1 和来自 df2 的收入按 id 和日期分组。
我做了这样的事情,但出现错误。
df.groupby(['id','date']).agg({'ratio': lambda L: df1['revenue'].div(df2['revenue'])})
数据
df1 = pd.DataFrame({'id':['x1', 'x2'],
'date':['2021-01-02',
'2021-01-03'],
'revenue':[50,10]})
df2 = pd.DataFrame({'id':['x2', 'x1', 'x1'],
'date':['2021-01-03','2021-01-02', '2021-01-01'],
'revenue':[100,100, 200]})
预计 output
id date ratio
0 x2 2021-01-03 0.5
1 x1 2021-01-02 0.1
2 x1 2021-01-01 0
使用DataFrame.merge
按列id
和date
左连接,然后将缺失值除以0
并替换:
s = df2.merge(df1, on=['id','date'], how='left')['revenue_y'].div(df2['revenue'])
df2['ratio'] = s.fillna(0)
print (df2)
id date revenue ratio
0 x2 2021-01-03 100 0.1
1 x1 2021-01-02 100 0.5
2 x1 2021-01-01 200 0.0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.