如何根據其他列中的條件將pandas df列中的多個值更改為np.nan？

Question

我沒有太多的編碼經驗，這是我的第一個問題，所以請耐心等待我。 我需要找到一種方法，根據另一列中的條件，將pandas df列的多個值更改為np.nan。 因此，我創建了所需列“Vorgabe”和“Temp”的副本。

每當“Grad”中的值不為0時，我想將“Vorgabe”和“Temp”中的definded區域中的值更改為np.nan。

print(df)  

    OptOpTemp  OpTemp  BSP  Grad  Vorgabe  Temp
0        22.0    20.0    5   0.0     22.0  20.0
1        22.0    20.5    7   0.0     22.0  20.5
2        22.0    21.0    8   1.0     22.0  21.0
3        22.0    21.0    6   0.0     22.0  21.0
4        22.0    23.5    7   0.0     22.0  20.0
5        23.0    21.5    1   0.0     23.0  21.5
6        24.0    22.5    3   1.0     24.0  22.5
7        24.0    23.0    4   0.0     24.0  23.0
8        24.0    25.5    9   0.0     24.0  25.5

所以我想實現這樣的目標：

    OptOpTemp  OpTemp  BSP  Grad  Vorgabe  Temp
0        22.0    20.0    5   0.0     22.0  20.0
1        22.0    20.5    7   0.0     nan   nan      <-one row above
2        22.0    21.0    8   1.0     nan   nan
3        22.0    21.0    6   0.0     nan   nan      <-one row among
4        22.0    23.5    7   0.0     22.0  20.0
5        23.0    21.5    1   0.0     nan   nan
6        24.0    22.5    3   1.0     nan   nan
7        24.0    23.0    4   0.0     nan   nan
8        24.0    25.5    9   0.0     24.0  25.5

有人能解決我的問題嗎？

編輯：我可能不清楚。 目標是將定義區域中“Vorgabe”和“Temp”中的每個值更改為nan。 在我的例子中，區域將在上面一行，行中有1.0，其中一行。 因此，不僅是1.0所在的行，還有上面和下面的行。

Answer 1

使用loc ：

df.loc[df.Grad != 0.0, ['Vorgabe', 'Temp']] = np.nan
print(df)

產量

   OptOpTemp  OpTemp  BSP  Grad  Vorgabe  Temp
0       22.0    20.0    5   0.0     22.0  20.0
1       22.0    20.5    7   0.0     22.0  20.5
2       22.0    21.0    8   1.0      NaN   NaN
3       22.0    21.0    6   0.0     22.0  21.0
4       22.0    23.5    7   0.0     22.0  20.0
5       23.0    21.5    1   0.0     23.0  21.5
6       24.0    22.5    3   1.0      NaN   NaN
7       24.0    23.0    4   0.0     24.0  23.0
8       24.0    25.5    9   0.0     24.0  25.5

Answer 2

你可以使用numpy.where 。

import numpy as np

df['Vorbage']=np.where(df['Grad']!=0, df['OptOpTemp'], np.nan)
df['Temp']=np.where(df['Grad']!=0, df['OpTemp'], np.nan)

Answer 3

鏈條3條件| 對於bitwise OR ，對於高於和低於1行，使用帶有shift掩碼：

mask1 = df['Grad'] == 1
mask2 = df['Grad'].shift() == 1
mask3 = df['Grad'].shift(-1) == 1

mask1 = df['Grad'] != 0
mask2 = df['Grad'].shift() != 0
mask3 = df['Grad'].shift(-1) != 0

mask = mask1 | mask2 | mask3

df.loc[mask, ['Vorgabe', 'Temp']] = np.nan
print (df)
   OptOpTemp  OpTemp  BSP  Grad  Vorgabe  Temp
0       22.0    20.0    5   0.0     22.0  20.0
1       22.0    20.5    7   0.0      NaN   NaN
2       22.0    21.0    8   1.0      NaN   NaN
3       22.0    21.0    6   0.0      NaN   NaN
4       22.0    23.5    7   0.0     22.0  20.0
5       23.0    21.5    1   0.0      NaN   NaN
6       24.0    22.5    3   1.0      NaN   NaN
7       24.0    23.0    4   0.0      NaN   NaN
8       24.0    25.5    9   0.0     24.0  25.5

多行的一般解決方案：

N = 1
#create range for test value betwen -N to N
r = np.concatenate([np.arange(0, N+1), np.arange(-1, -N-1, -1)])
#create boolean mask by comparing with shift and join together by reduce 
mask = np.logical_or.reduce([df['Grad'].shift(x) == 1 for x in r])

df.loc[mask, ['Vorgabe', 'Temp']] = np.nan

編輯：

您可以將兩個面具連接在一起：

N = 1
r1 = np.concatenate([np.arange(0, N+1), np.arange(-1, -N-1, -1)])
mask1 = np.logical_or.reduce([df['Grad'].shift(x) == 1 for x in r1])

N = 2
r2 = np.concatenate([np.arange(0, N+1), np.arange(-1, -N-1, -1)])
mask2 = np.logical_or.reduce([df['Grad'].shift(x) == 1.5 for x in r2])
#if not working ==1.5 because precision of floats
#mask2 = np.logical_or.reduce([np.isclose(df['Grad'].shift(x), 1.5) for x in r2])

mask = mask1 | mask2
df.loc[mask, ['Vorgabe', 'Temp']] = np.nan
print (df)
   OptOpTemp  OpTemp  BSP  Grad  Vorgabe  Temp
0       22.0    20.0    5   0.0     22.0  20.0
1       22.0    20.5    7   0.0      NaN   NaN
2       22.0    21.0    8   1.0      NaN   NaN
3       22.0    21.0    6   0.0      NaN   NaN
4       22.0    23.5    7   0.0      NaN   NaN
5       23.0    21.5    1   0.0      NaN   NaN
6       24.0    22.5    3   1.5      NaN   NaN <- changed value to 1.5
7       24.0    23.0    4   0.0      NaN   NaN
8       24.0    25.5    9   0.0      NaN   NaN

Answer 4

您可以使用df.apply(f,axis=1) ，並將f定義為您想要在每一行上執行的操作。 你的描述似乎在說你想要的

 def f(row):
     if row['Grad']!=0:
         row.loc[['Vorgabe','Temp']]=np.nan
     return row

但是，你的例子似乎在說你想要別的東西。

如何根據其他列中的條件將pandas df列中的多個值更改為np.nan？

問題描述

4 個解決方案

解決方案1
5 2019-01-07 16:13:08

解決方案2
3 2019-01-07 16:12:08

解決方案3
1 已采納 2019-01-08 14:53:28

解決方案4
0 2019-01-07 16:25:03

如何根據其他列中的條件將pandas df列中的多個值更改為np.nan？

問題描述

4 個解決方案

解決方案1 5 2019-01-07 16:13:08

解決方案2 3 2019-01-07 16:12:08

解決方案3 1 已采納 2019-01-08 14:53:28

解決方案4 0 2019-01-07 16:25:03

解決方案1
5 2019-01-07 16:13:08

解決方案2
3 2019-01-07 16:12:08

解決方案3
1 已采納 2019-01-08 14:53:28

解決方案4
0 2019-01-07 16:25:03