如何从熊猫数据框中的csv中删除'\\ N'空值

Question

我有一个12064行x 220列的csv文件，其中一些空值以'\\ N'形式编写。 我正在通过以下方式将csv数据读取到熊猫数据df = pd.read_csv('my_csv') ： df = pd.read_csv('my_csv')

处理/删除空值以便对数据执行下游分析的最佳方法是什么？ 我在想，也许最好将'\\ N'字符串转换为'NaN'并使用df.dropna（）方法。 如果这是最佳选择，我该怎么做？ 谢谢。

Answer 1

我在想也许最好将'\\ N'字符串转换为'NaN'并使用df.dropna（）方法

pandas.read_csv()具有一个参数

na_values : list-like or dict, default None
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values

所以，例如

pandas.read_csv('my.csv', na_values=['\N'])

然后，您可以轻松地在其上使用dropna()

如何从熊猫数据框中的csv中删除&#39;\\ N&#39;空值