熊貓：計算有條件的連續行

Question

我有一張這樣的表：

name = ['a','a','a','a','a','b','b','b','b']
fillrate = [0.1, 0.1, 0.2, 0.1, 0.1, 0.3, 0.3, 0.3, 0.4]
df = pd.DataFrame(name)
df.columns = ['name']
df['fillrate'] = fillrate

我想創建一個這樣的列：

df['count'] = [1,2,1,2,3,1,2,3,1]

說明：當有新名稱或填充率增加時，'count' 列重置為 1； 否則，'count' 列等於最后一個值加 1。

使用循環很容易做到這一點，但我想避免這種情況，因為數據很大。 有沒有其他方法可以做到？

Answer 1

IIUC 讓我們將shift與diff結合起來，並使用cumsum創建子組cumcount

s=(df.name.ne(df.name.shift()) | df.fillrate.diff().gt(0)).cumsum()
s.groupby(s).cumcount()+1
Out[17]: 
0    1
1    2
2    1
3    2
4    3
5    1
6    2
7    3
8    1
dtype: int64

熊貓：計算有條件的連續行

問題描述

1 個解決方案

解決方案1
5 2020-02-04 15:59:12

熊貓：計算有條件的連續行

問題描述

1 個解決方案

解決方案1 5 2020-02-04 15:59:12

解決方案1
5 2020-02-04 15:59:12