如何在熊貓數據框中找到連續值的最后一個值？

Question

我有一個這樣的數據框

df:
col1     col2
 1        10
 1        20
 2        11
 3        33
 1        20
 1        10
 2        24
 3        21
 3        28

我想在col1上有連續值的數據幀中進行分組，並為每個連續組取最后一個值，

最終的數據幀應如下所示：

df
col1    col2
 1       20
 2       11
 3       33
 1       10
 2       24
 3       28

我已經嘗試過類似的東西：

 df['b_new'] = df.groupby('col1')['col2'].transform('last')

但是它缺少連續條件。

如何使用pandas / python以最有效的方式實現它

Answer 1

對最后重復的連續行使用boolean indexing ，將Series.ne和Series.shift ed Series一起使用-1過濾：

df1 = df[df['col1'].ne(df['col1'].shift(-1))]
print (df1)
   col1  col2
1     1    20
2     2    11
3     3    33
5     1    10
6     2    24
8     3    28

詳細說明 ：

print (df['col1'].ne(df['col1'].shift(-1)))
0    False
1     True
2     True
3     True
4    False
5     True
6     True
7    False
8     True
Name: col1, dtype: bool

如何在熊貓數據框中找到連續值的最后一個值？

問題描述

1 個解決方案

解決方案1
2 已采納 2019-06-19 07:59:10

如何在熊貓數據框中找到連續值的最后一個值？

問題描述

1 個解決方案

解決方案1 2 已采納 2019-06-19 07:59:10

解決方案1
2 已采納 2019-06-19 07:59:10