根據同一列中的其他值將列中的值替換為NaN

Question

這是標題中問題的特殊情況。

我有以下數據框：

values = [[100,54,25,26,32,33,15,2],[1,2,3,4,5,6,7,8]]
columns = ["numbers", "order"]
zipped = dict(zip(columns,values))
df = pd.DataFrame(zipped)
print(df)

   numbers  order
0      100      1
1       54      2
2       25      3
3       26      4
4       32      5
5       33      6
6       15      7
7        2      8

想象一下，數據框按列順序升序排列。 在列號中，如果行下方存在較大的值，我想用NaN替換值，並實現以下結果：

   numbers  order
0      100      1
1       54      2
2      NaN      3
3      NaN      4
4      NaN      5
5       33      6
6       15      7
7        2      8

在沒有循環的情況下實現此目標的最佳方法是什么？

更新：初始DF和預期結果的更好的示例（添加要替換的不連續值塊）：

values = [[100,54,25,26,34,32,31,33,15,2],[1,2,3,4,5,6,7,8,9,10]]

   numbers  order
0      100      1
1       54      2
2       25      3
3       26      4
4       34      5
5       32      6
6       31      7
7       33      8
8       15      9
9        2     10

結果：

   numbers  order
0    100.0      1
1     54.0      2
2      NaN      3
3      NaN      4
4     34.0      5
5      NaN      6
6      NaN      7
7     33.0      8
8     15.0      9
9      2.0     10

Answer 1

我的理解略有不同，如果數字低於以下，則表示其反向cummax更高：

In [11]: df.at[3, 'numbers'] = 24  # more illustrative example 

In [12]: df.numbers[::-1].cummax()[::-1]
Out[12]:
0    100
1     54
2     33
3     33
4     33
5     33
6     15
7      2
Name: numbers, dtype: int64

In [13]: df.loc[df.numbers < df.numbers[::-1].cummax()[::-1], 'numbers'] = np.nan

In [14]: df
Out[14]:
   numbers  order
0    100.0      1
1     54.0      2
2      NaN      3
3      NaN      4
4      NaN      5
5     33.0      6
6     15.0      7
7      2.0      8

Answer 2

您可以遍歷列的值，並檢查它是否大於后面的所有元素：

arr = df['numbers'].values
df['numbers'] = [x if all(x > arr[n+1:]) else np.nan for n, x in enumerate(arr)]
df

輸出：

   numbers  order
0    100.0      1
1     54.0      2
2      NaN      3
3      NaN      4
4      NaN      5
5     33.0      6
6     15.0      7
7      2.0      8

根據同一列中的其他值將列中的值替換為NaN

問題描述

2 個解決方案

解決方案1
6 已采納 2019-02-05 19:30:36

解決方案2
1 2019-02-05 19:32:35

根據同一列中的其他值將列中的值替換為NaN

問題描述

2 個解決方案

解決方案1 6 已采納 2019-02-05 19:30:36

解決方案2 1 2019-02-05 19:32:35

解決方案1
6 已采納 2019-02-05 19:30:36

解決方案2
1 2019-02-05 19:32:35