根據組比較過濾熊貓數據框組

Question

我正在嘗試從熊貓數據框中刪除損壞的數據。 我想從值框大於上一個組的值差異的數據框中刪除組。 這是一個例子：

   Value
0      1
1      1
2      1
3      2
4      2
5      2
6      8 <- here number of group if I groupby by Value is larger than
7      8    the last groups number by 6, so I want to remove this
8      3    group from dataframe
9      3

預期結果：

編輯：jezrael解決方案很棒，但就我而言，可能會有重復的組值：

對不起，如果我不清楚。

Answer 1

首先刪除唯一行的重復項，然后將差異與移位后的值進行比較，最后通過布爾索引進行過濾：

s = df['Value'].drop_duplicates()
v = s[s.diff().gt(s.shift())]

df = df[~df['Value'].isin(v)]
print (df)
   Value
0      1
1      1
2      1
3      2
4      2
5      2
8      3
9      3

Answer 2

也許：

df2 = df.drop_duplicates()
print(df[df['Value'].isin(df2.loc[~df2['Value'].gt(df2['Value'].shift(-1)), 'Value'].tolist())])

輸出：

Answer 3

我們可以檢查差異是否小於或等於5 或 NaN 。 在檢查是否有重復項並保留這些行之后：

s = df[df['Value'].diff().le(5) | df['Value'].diff().isna()]
s[s.duplicated(keep=False)]

根據組比較過濾熊貓數據框組

問題描述

3 個解決方案

解決方案1
3 已采納 2019-06-21 11:07:35

解決方案2
1 2019-06-21 11:07:37

解決方案3
0 2019-06-21 11:15:11

根據組比較過濾熊貓數據框組

問題描述

3 個解決方案

解決方案1 3 已采納 2019-06-21 11:07:35

解決方案2 1 2019-06-21 11:07:37

解決方案3 0 2019-06-21 11:15:11

解決方案1
3 已采納 2019-06-21 11:07:35

解決方案2
1 2019-06-21 11:07:37

解決方案3
0 2019-06-21 11:15:11