繁体   English   中英

pandas.read_csv 的 Nan 问题

[英]Nan issue with pandas.read_csv

我正在尝试读取带有标题的数据文件。 数据文件已附加,我正在使用以下代码:

import pandas as pd
data=pd.read_csv('TestData.out', sep=' ', skiprows=1, header=None)

问题是我的数据文件中有 20 列,而变量数据中有 32 列。 我该如何解决这个问题。 我对 Python 很陌生,我正在学习。

数据文件

您的文本文件有两个空格,来自任何没有减号的值。 如果sep=' ' ,pandas 将其视为两个分隔符,中间没有任何内容 ( Nan )。

这将修复它:

data = pd.read_csv('TestData.out', sep='\s+', skiprows=1, header=None)

在这种情况下, sep被解释为一个正则表达式,它寻找“多个空格之一”作为分隔符,并重新生成第 0 列到第 19 列。

您的数据文件的空格分隔不一致。 因此,您只需跳过分隔符后的后续空格。 这个简单的代码有效:

data= pd.read_csv('TestData.out',sep=' ',skiprows=1,skipinitialspace=True)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM