熊猫将每组中两列之间的差异求和

Question

我有一个df样子，

A               B              C    D
2017-10-01      2017-10-11     M    2017-10
2017-10-02      2017-10-03     M    2017-10
2017-11-01      2017-11-04     B    2017-11
2017-11-08      2017-11-09     B    2017-11
2018-01-01      2018-01-03     A    2018-01

A和B的dtype是datetime64 ， C和D是strings ;

我喜欢对C和D进行groupby ，以得到B和A之间的差异，

df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A'])

但是我不知道如何将每组中的差异求和并将值分配给新列E （可能是新df ，

C    D          E
M    2017-10    11
M    2017-10    11
B    2017-11    4
B    2017-11    4
A    2018-01    2

Answer 1

根据您的代码

df.merge(df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A']).sum(level=[0,1]).reset_index())
Out[292]: 
           A          B  C        D       0
0 2017-10-01 2017-10-11  M  2017-10 11 days
1 2017-10-02 2017-10-03  M  2017-10 11 days
2 2017-11-01 2017-11-04  B  2017-11  4 days
3 2017-11-08 2017-11-09  B  2017-11  4 days
4 2018-01-01 2018-01-03  A  2018-01  2 days

熊猫将每组中两列之间的差异求和

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-03-16 16:03:29

熊猫将每组中两列之间的差异求和

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-03-16 16:03:29

解决方案1
1 已采纳 2018-03-16 16:03:29