![](/img/trans.png)
[英]why I Can't drop NAN values with dropna() function in pandas
[英]How can I drop duplicates in pandas without dropping NaN values
我有一個 dataframe 查詢,我只想從某個列中獲取唯一值。
我嘗試執行此代碼:
database = pd.read_csv(db_file, sep='\t')
query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])
db_specification
只是一個包含我查詢的兩列的列表。
有些值是NaN
,我不想認為它們是重復的,我該如何實現呢?
您可以首先選擇所有NaN
,然后在 dataframe 的 rest 上刪除重復項。
mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.