繁体   English   中英

如果第一列中的元素等于上一行,则增加第二列的值

[英]increment second columns value if element in the first column equals to previous row

有与此类似的问题,但我真正要问的是有点不同。

我想知道是否有一种方法可以在没有 for 循环(使用 map 或柱状计算)的情况下实现以下代码(如果可能或最快的方式)。

我有一个包含 m 行(>1E7)和 n 列的 DataFrame(df)。 列 j+1 以全 1 或全 0 开始。

for i in range(len(df)):
    if df.iloc[i, j] == df.iloc[i-1, j]: 
        df.iloc[i, j+1] = df.iloc[i-1, j+1]+1

所以示例 output 将如下所示:

    ... j j+1 ...
  0 ... 3  1  ...
  1 ... 4  1  ...
  2 ... 4  2  ...
  3 ... 4  3  ...
  4 ... 6  1  ...
  5 ... 6  2  ...
  6 ... 7  1  ...

肯定有一些问题可以回答这个问题:

s = df.iloc[:,j]
blocks = s.ne(s.shift()).cumsum()
df.iloc[:,j+1]= s.groupby(blocks).cumcount() + 1

Output:

   ...  j  j+1   ...
0  ...  3    1   ...
1  ...  4    1   ...
2  ...  4    2   ...
3  ...  4    3   ...
4  ...  6    1   ...
5  ...  6    2   ...
6  ...  7    1   ...

听起来这就是你想要的。

df['j+1'] = df.groupby('j').cumcount() + 1

Output:

    j   j+1
0   3   1
1   4   1
2   4   2
3   4   3
4   6   1
5   6   2
6   7   1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM