如何計算條件在 pandas 的列中連續存在的次數

Question

我有一個像這樣的簡單 df：

我有興趣計算1連續出現的次數，然后創建一個列，將該值分配給塊中的每一行。 它應該如下所示：

    data   count
0    0       0
1    0       0
2    1       2
3    1       2
4    0       0
5    0       0
6    1       4
7    1       4
8    1       4
9    1       4

有沒有簡單的 pandas 方法來做到這一點？

Answer 1

另一種方式：

import pandas as pd
df = pd.DataFrame({'data': [0, 0, 1, 1, 0, 0, 1, 1, 1, 1]})

df['count'] = 0
m = df['data'] == 1
df.loc[m, 'count'] = df.loc[m, 'data'].groupby(by=(~m).cumsum()).transform("count")

它給：

  data  count
0     0      0
1     0      0
2     1      2
3     1      2
4     0      0
5     0      0
6     1      4
7     1      4
8     1      4
9     1      4

Answer 2

使用 np.where, cumsum

df['count']=np.where(df['data'].eq(1),(df['data']!=df['data'].shift(1)).cumsum(),df['data'])



    data  count
0     0      0
1     0      0
2     1      2
3     1      2
4     0      0
5     0      0
6     1      4
7     1      4
8     1      4
9     1      4

如何計算條件在 pandas 的列中連續存在的次數

問題描述

2 個解決方案

解決方案1
0 2022-01-05 21:16:16

解決方案2
-1 2022-01-05 20:39:44

如何計算條件在 pandas 的列中連續存在的次數

問題描述

2 個解決方案

解決方案1 0 2022-01-05 21:16:16

解決方案2 -1 2022-01-05 20:39:44

解決方案1
0 2022-01-05 21:16:16

解決方案2
-1 2022-01-05 20:39:44