![](/img/trans.png)
[英]Only keep pandas columns where value_count of all values greater than some threshold;
[英]Keep running count of number of values greater than threshold in pandas dataframe
在以下数据框中:
va
0 35
1 12
2 24
3 25
4 26
5 19
6 14
7 22
8 35
9 35
10 29
11 13
12 20
13 10
14 10
15 23
16 11
17 30
18 26
19 32
20 11
我想对va
列值超过30的行数进行连续计数。我当时在考虑使用value_counts
但这似乎不对。
有2个解决方案-将count重置为new
列,另一个解决方案而不重置为new1
:
a = df['va'].gt(30)
b = a.cumsum()
df['new'] = b-b.mask(a).ffill().fillna(0).astype(int)
df['new1'] = b.where(a, 0)
print (df)
va new new1
0 35 1 1
1 12 0 0
2 24 0 0
3 25 0 0
4 26 0 0
5 19 0 0
6 14 0 0
7 22 0 0
8 35 1 2
9 35 2 3
10 29 0 0
11 13 0 0
12 20 0 0
13 10 0 0
14 10 0 0
15 23 0 0
16 11 0 0
17 30 0 0
18 26 0 0
19 32 1 4
20 11 0 0
要获取行数,可以执行以下操作:
your_counter = len(your_df[your_df['va'] > 30])
(“ your_df”显然应该替换为数据框的名称)
代码正在执行的操作是创建一个新的数据框,其中仅包含“ va”值超过30的行。然后,“ len”函数将对行数进行计数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.