繁体   English   中英

如何从熊猫数据框中的csv中删除'\\ N'空值

[英]How to remove '\N' null values from csv from a pandas dataframe

我有一个12064行x 220列的csv文件,其中一些空值以'\\ N'形式编写。 我正在通过以下方式将csv数据读取到熊猫数据df = pd.read_csv('my_csv')df = pd.read_csv('my_csv')

处理/删除空值以便对数据执行下游分析的最佳方法是什么? 我在想,也许最好将'\\ N'字符串转换为'NaN'并使用df.dropna()方法。 如果这是最佳选择,我该怎么做? 谢谢。

我在想也许最好将'\\ N'字符串转换为'NaN'并使用df.dropna()方法

pandas.read_csv()具有一个参数

na_values : list-like or dict, default None
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values

所以,例如

pandas.read_csv('my.csv', na_values=['\N'])

然后,您可以轻松地在其上使用dropna()

ref, http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM