計算 pandas df 中連續列值的數量

Question

我有一個像這樣的列的df：

我想計算 col1 中每個值在某個閾值以上的連續出現次數。 因此，如果閾值為 0，則 output 應類似於：

1: 2
2: 1

如果閾值為 3，則 output 應類似於：

1: 1
2: 1

我知道循環列值並僅跟蹤連續鏈會起作用，但我想知道是否有 pandas 方法可以更快地做到這一點？

Answer 1

這是使用diff和cumsum創建附加密鑰的一種方法

s=df.groupby([df.col1,df.col1.diff().ne(0).cumsum()]).size()
s
Out[198]: 
col1  col1
1     1       3
      3       4
2     2       4
dtype: int64

thresh=3
s[s>thresh].count(level=0)
Out[201]: 
col1
1    1
2    1
dtype: int64

從這里

df.col1.diff().ne(0).cumsum() # we bring the continue value into one value 
Out[202]: 
0     1
1     1
2     1
3     2
4     2
5     2
6     2
7     3
8     3
9     3
10    3
Name: col1, dtype: int32

計算 pandas df 中連續列值的數量

問題描述

1 個解決方案

解決方案1
3 已采納 2020-07-30 03:22:40

計算 pandas df 中連續列值的數量

問題描述

1 個解決方案

解決方案1 3 已采納 2020-07-30 03:22:40

解決方案1
3 已采納 2020-07-30 03:22:40