[英]Nan issue with pandas.read_csv
我正在尝试读取带有标题的数据文件。 数据文件已附加,我正在使用以下代码:
import pandas as pd
data=pd.read_csv('TestData.out', sep=' ', skiprows=1, header=None)
问题是我的数据文件中有 20 列,而变量数据中有 32 列。 我该如何解决这个问题。 我对 Python 很陌生,我正在学习。
您的文本文件有两个空格,来自任何没有减号的值。 如果sep=' '
,pandas 将其视为两个分隔符,中间没有任何内容 ( Nan
)。
这将修复它:
data = pd.read_csv('TestData.out', sep='\s+', skiprows=1, header=None)
在这种情况下, sep
被解释为一个正则表达式,它寻找“多个空格之一”作为分隔符,并重新生成第 0 列到第 19 列。
您的数据文件的空格分隔不一致。 因此,您只需跳过分隔符后的后续空格。 这个简单的代码有效:
data= pd.read_csv('TestData.out',sep=' ',skiprows=1,skipinitialspace=True)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.