[英]Why doesn't dropna seem to work on this column?
默認情況下, pandas.read_csv
不將“ na”視為NaN
。
您可以通過na_values
參數將其手動添加為NaN
字符串:
df = pd.read_csv('file.csv', na_values=['na'])
根據文檔 :
na_values :標量,str,類似列表的字典或dict,默認為None
識別為NA / NaN的其他字符串。 如果dict通過,則為特定的每列NA值。 默認情況下,以下值解釋為NaN:'','#N / A','#N / AN / A','#NA','-1.#IND','-1.#QNAN', '-NaN','-nan','1.#IND','1.#QNAN','N / A','NA','NULL','NaN','n / a','nan ', '空值'。
看起來此屏幕快照中的值不是“ NaN”或某些實際錯誤,而是解析后的值“ na”的字符串。
為了在此列中使用此值過濾出行,可以使用只是簡單地用條件引用df,而不是使用dropna:
df = pd.read_csv(...)
filtered_df = df[df['Filmname'] != 'na']
里面的情況可能是任何情況,請參閱本指南以開始
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.