簡體   English   中英

Pandas 數據框中的值過濾器保持 NaN

[英]Value filter in pandas dataframe keeping NaN

我正在嘗試從數據框中過濾小於某個值的數據。 如果沒有 NaN 則它工作正常。 但是當有 nan 時,它會忽略 NaN 值。 我想一直包含它並不重要,它小於或大於比較值。

import pandas as pd
import numpy as np

df = pd.DataFrame(
    {
        'index': [1, 2, 3,  4,  5,  6,   7,  8, 9],
        'value': [5, 6, 7, np.nan, 9, 3, 11, 34, 78]
    }
)

df_chunked = df[(df['index'] >= 1) & (df['index'] <= 5)]

print('df_chunked')
print(df_chunked)

df_result = df_chunked[(df_chunked['value'] < 10)]
# df_result = df_chunked[(df_chunked['value'] < 10) | (df_chunked['value'] == np.isnan(df_chunked['value']))]

print('df_result')
print(df_result)

在此處輸入圖片說明

在上面的結果中顯示 5,6,7,9。 但我也想要那里的 nan。 我試過

df_result = df_chunked[(df_chunked['value'] < 10) | (df_chunked['value'] == np.isnan(df_chunked['value']))]

但它不起作用。

我怎樣才能做到這一點?

使用運算符: ~

df_chunked[~(df_chunked['value'].ge(10))]
#df_chunked[~(df_chunked['value']>=10)] #greater or equal(the same)

   index  value
0      1    5.0
1      2    6.0
2      3    7.0
3      4    NaN
4      5    9.0

為什么?

因為邏輯運算簡單地忽略NaN值並將其視為False ,始終如您在以下數據框中看到的那樣,如果您想避免使用series.isna (避免不必要的附加代碼)並簡化您的代碼,只需使用逆邏輯與~

print(df.assign(greater_than_5 = df['value'].gt(5),
          not_greater_than_5 = df['value'].le(5)))


   index  value  greater_than_5  not_greater_than_5
0      1    5.0           False                True
1      2    6.0            True               False
2      3    7.0            True               False
3      4    NaN           False               False
4      5    9.0            True               False
5      6    3.0           False                True
6      7   11.0            True               False
7      8   34.0            True               False
8      9   78.0            True               False

嘗試:

df_result = df_chunked[(df_chunked['value'] < 10) | (df_chunked['value'].isna())]
df_result 
   index  value
0      1    5.0
1      2    6.0
2      3    7.0
3      4    NaN
4      5    9.0

您可以簡單地定義您的 df_result 如下:

df_result = df_chunked[(df_chunked["value"] < 10) | (df_chunked["value"].isnull())]

那個有效。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM