簡體   English   中英

如何在不刪除 NaN 值的情況下刪除 pandas 中的重復項

[英]How can I drop duplicates in pandas without dropping NaN values

我有一個 dataframe 查詢,我只想從某個列中獲取唯一值。
我嘗試執行此代碼:

    database = pd.read_csv(db_file, sep='\t')
    query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])

db_specification只是一個包含我查詢的兩列的列表。
有些值是NaN ,我不想認為它們是重復的,我該如何實現呢?

您可以首先選擇所有NaN ,然后在 dataframe 的 rest 上刪除重復項。

mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM