[英]Pandas dataframe how to remove rows conditioned on the length of rows being smaller than a number, given a unique column value?
我有一個看起來像的數據框
date id params
123 2016-03-02 0A122B 23.7
124 2016-03-03 0A122B 25.5
125 2016-03-04 0A122B 29.7
126 2016-03-07 0A122B 26.4
...
456 2016-03-02 3B778C 1050
457 2016-03-03 3B778C 1350
458 2016-03-04 3B778C 2900
...
1255 2016-03-02 5D898F 135.88
1256 2016-03-03 5D898F 189.55
1257 2016-03-04 5D898F 205.22
1258 2016-03-07 5D898F 278.35
1259 2016-03-08 5D898F 145.64
對於特定的唯一id
,它具有date
行及其params
。 請注意, id
的行數長度可以不同。 例如, 0A122B
可能只有長度為 48 的date
數據,而5D898F
可能有長度為1255
數據。
我想知道一種刪除數據行的方法,其中對於特定的id
例如0A122B
,其總行數小於一個數字,例如 50,對於每個id
。
嘗試使用groupby
:
output = df[df.groupby("id")["date"].transform("count")>50]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.