
[英]Pandas: Filter DataFrameGroupBy (df.groupby) based on group aggregates
[英]Pandas groupby key then filter based on group and return keys
熊猫执行以下操作的方式是什么?
data.groupby('id').duration.max().index[data.groupby('id').duration.max() > 365]
我不想按ID分组,然后使用组过滤并在条件为真的情况下返回ID。
使用group.filter函数返回原始数据帧。
您可以重写代码-从聚合函数max
和index
调用Series
boolean indexing
:
s = data.groupby('id').duration.max()
idx = s.index[s > 365]
#alternative
#idx = s[s > 365].index
您还可以检查Series
过滤值:
print(s[s > 365])
但是,如果要过滤原始DataFrame
由max
每组值添加GroupBy.transform
退货Series
具有相同尺寸的原始DataFrame
:
data[data.groupby('id').duration.transform('max') > 365]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.