[英]Merge and sum two pandas rows based on if condition
我有一个巨大的 dataframe ,我只想merge only two rows in it based on if condition
。 下面是一个示例数据框,当我尝试进行groupby sum
时,其他行也会受到影响。
我只希望列jb_name
与generic
得到merged and sum
。
jb_name jb_count
0 generic 10
1 generic1 2
2 generic 15
3 other 14
尝试了以下,但正如我所说,它也会影响其他行
df = df.groupby(['jb_name'])['jb_count'].sum().reset_index()
我想要最终的df如下
jb_name jb_count
0 generic 25
1 generic1 2
3 other 14
利用:
mask = df['jb_name'] == 'generic'
df = df[mask].groupby('jb_name', as_index=False).sum().append(df[~mask], ignore_index=True)
或者,我们可以将索引设置为jb_name
并在索引为generic
的level 0
上使用sum
:
df = df.set_index('jb_name')
mask = (df.index == 'generic')
df1 = pd.concat([df[mask].sum(level=0), df[~mask]]).reset_index()
结果:
# print(df1)
jb_name jb_count
0 generic 25
1 generic1 2
2 other 14
#Bollean select, droupby as you sum the duplicated and append tthe no duplicates
m=df.jb_name=='generic'
df[m].groupby(by='jb_name', axis=0).sum().reset_index().append(df[~m])
jb_name jb_count
0 generic 25
1 generic1 2
3 other 14
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.