繁体   English   中英

给定唯一的列值,Pandas 数据框如何删除以行长小于数字为条件的行?

[英]Pandas dataframe how to remove rows conditioned on the length of rows being smaller than a number, given a unique column value?

我有一个看起来像的数据框

     date        id      params 
123  2016-03-02  0A122B  23.7
124  2016-03-03  0A122B  25.5
125  2016-03-04  0A122B  29.7
126  2016-03-07  0A122B  26.4
... 
456  2016-03-02  3B778C  1050
457  2016-03-03  3B778C  1350
458  2016-03-04  3B778C  2900
...
1255 2016-03-02  5D898F  135.88
1256 2016-03-03  5D898F  189.55
1257 2016-03-04  5D898F  205.22
1258 2016-03-07  5D898F  278.35
1259 2016-03-08  5D898F  145.64

对于特定的唯一id ,它具有date行及其params 请注意, id的行数长度可以不同。 例如, 0A122B可能只有长度为 48 的date数据,而5D898F可能有长度为1255数据。

我想知道一种删除数据行的方法,其中对于特定的id例如0A122B ,其总行数小于一个数字,例如 50,对于每个id

尝试使用groupby

output = df[df.groupby("id")["date"].transform("count")>50]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM