為什么dropna在該專欄上似乎不起作用？

Question

我嘗試將所有na值都放在一列Filmname ，但不會刪除這些值。 為什么？ （我的結果的屏幕截圖）

這是我的代碼：

import pandas as pd
df = read.csv....

df.dropna(subset=['Filmname'], inplace=True)
df.head()

Answer 1

默認情況下， pandas.read_csv不將“ na”視為NaN 。

您可以通過na_values參數將其手動添加為NaN字符串：

df = pd.read_csv('file.csv', na_values=['na'])

根據文檔：

na_values ：標量，str，類似列表的字典或dict，默認為None

識別為NA / NaN的其他字符串。 如果dict通過，則為特定的每列NA值。 默認情況下，以下值解釋為NaN：''，'＃N / A'，'＃N / AN / A'，'＃NA'，'-1.＃IND'，'-1.＃QNAN'， '-NaN'，'-nan'，'1.＃IND'，'1.＃QNAN'，'N / A'，'NA'，'NULL'，'NaN'，'n / a'，'nan '， '空值'。

Answer 2

看起來此屏幕快照中的值不是“ NaN”或某些實際錯誤，而是解析后的值“ na”的字符串。

為了在此列中使用此值過濾出行，可以使用只是簡單地用條件引用df，而不是使用dropna：

df = pd.read_csv(...)
filtered_df = df[df['Filmname'] != 'na']

里面的情況可能是任何情況，請參閱本指南以開始

為什么dropna在該專欄上似乎不起作用？

問題描述

2 個解決方案

解決方案1
3 2018-06-15 14:23:29

解決方案2
1 2018-06-15 14:20:35

為什么dropna在該專欄上似乎不起作用？

問題描述

2 個解決方案

解決方案1 3 2018-06-15 14:23:29

解決方案2 1 2018-06-15 14:20:35

解決方案1
3 2018-06-15 14:23:29

解決方案2
1 2018-06-15 14:20:35