繁体   English   中英

Python:具有多个条件的熊猫总和

[英]Python : Pandas Sum with more than one condition

我想知道如何根据另一列的值(0或1)对一列求和

   id   area PP
a   0,95999998  0
a   0,44    1
b   1,6900001   0
c   2   0
d   5,8499999   0
e   0,66000003  1

我可以找到每个ID的区域

surface_id = df.groupby("id")["area"].sum()

但是我还想要的是如果PP = 1的id来得到这样的区域:

   id   area_PP
a   0,44
b   0   
c   0
d   0
e   0,66000003

尝试:

df.eval('area * PP').groupby(df.id).sum()

只需将area列乘以PP列即可。 0自然会适当地抵消该area

我选择使用eval是因为它比较凉爽,对于大数据来说应该更快。

这做同样的事情

(df.area * df.PP).groupby(df.id).sum()

一种使用变换但更长的方法

df['area_pp'] = df[df.PP == 1].groupby("id")["area"].transform('sum')
df.fillna(0, inplace = True)

    id  area        PP  area_pp
0   a   0,95999998  0   0
1   a   0,44        1   0,44
2   b   1,6900001   0   0
3   c   2           0   0
4   d   5,8499999   0   0
5   e   0,66000003  1   0,66000003

其他方式:

total=df.groupby(['id', 'PP'])['area'].sum().reset_index(level=1)
total[total.PP==1].drop(axis=1, labels='PP')

如果只想在输出中使用带有正标签的实例:

df = pd.DataFrame({'id': ('a', 'a', 'b', 'c', 'd', 'e'), 'area': (0.96, 0.44, 
1.69, 2., 5.85, 0.66), 'PP': (0, 1, 0, 0, 0, 1)})
df2 = df.where(df.PP==1).groupby('id')['area'].sum()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM