如果第一列中的元素等於上一行，則增加第二列的值

Question

有與此類似的問題，但我真正要問的是有點不同。

我想知道是否有一種方法可以在沒有 for 循環（使用 map 或柱狀計算）的情況下實現以下代碼（如果可能或最快的方式）。

我有一個包含 m 行（>1E7）和 n 列的 DataFrame(df)。 列 j+1 以全 1 或全 0 開始。

for i in range(len(df)):
    if df.iloc[i, j] == df.iloc[i-1, j]: 
        df.iloc[i, j+1] = df.iloc[i-1, j+1]+1

所以示例 output 將如下所示：

    ... j j+1 ...
  0 ... 3  1  ...
  1 ... 4  1  ...
  2 ... 4  2  ...
  3 ... 4  3  ...
  4 ... 6  1  ...
  5 ... 6  2  ...
  6 ... 7  1  ...

Answer 1

肯定有一些問題可以回答這個問題：

s = df.iloc[:,j]
blocks = s.ne(s.shift()).cumsum()
df.iloc[:,j+1]= s.groupby(blocks).cumcount() + 1

Output：

   ...  j  j+1   ...
0  ...  3    1   ...
1  ...  4    1   ...
2  ...  4    2   ...
3  ...  4    3   ...
4  ...  6    1   ...
5  ...  6    2   ...
6  ...  7    1   ...

Answer 2

聽起來這就是你想要的。

df['j+1'] = df.groupby('j').cumcount() + 1

Output：

如果第一列中的元素等於上一行，則增加第二列的值

問題描述

2 個解決方案

解決方案1
1 已采納 2020-10-26 18:17:56

解決方案2
1 2020-10-26 18:31:26

如果第一列中的元素等於上一行，則增加第二列的值

問題描述

2 個解決方案

解決方案1 1 已采納 2020-10-26 18:17:56

解決方案2 1 2020-10-26 18:31:26

解決方案1
1 已采納 2020-10-26 18:17:56

解決方案2
1 2020-10-26 18:31:26