Pandas.read_csv无法读取完整标题

Question

我有一个csv文件，其中保存了粒子的位置和速度，如下所示：

x, y, z, vx, vy, vz
-0.960, 0.870, -0.490, 962.17, -566.10, 713.40
1.450, 0.777, 2.270, -786.27, 63.31, -441.00
-3.350, -1.640, 1.313, 879.20, 637.76, -556.24
-0.504, 2.970, -0.278, 613.22, -717.32, 557.02
0.338, 0.220, 0.090, -927.18, -778.77, -443.05
...

我正在尝试读取此文件，并使用read_csv将其另存为Pandas数据框。 但是调用除第一列以外的任何列时都会出错

AttributeError：“ DataFrame”对象没有属性“ y”

我永远不会收到“ x”列的错误，所以我写了一个代码段以查看是否可以找出读取错误的根源。

import pandas as pd
data = pd.read_csv('snap.csv')
print data
print data.x
print data.y

控制台正确打印

          x      y      z       vx       vy       vz       
0    -0.960  0.870 -0.490   962.17  -566.10   713.40   
1     1.450  0.777  2.270  -786.27    63.31  -441.00   
2    -3.350 -1.640  1.313   879.20   637.76  -556.24  
3    -0.504  2.970 -0.278   613.22  -717.32   557.02  
4     0.338  0.220  0.090  -927.18  -778.77  -443.05 
...

表示正在为列分配正确的名称。 然后

0      -0.960
1       1.450
2      -3.350
3      -0.504
4       0.338  
...

显示它可以正确取出其中一列。 但是，当尝试打印第二列时，它将再次引发错误

AttributeError：“ DataFrame”对象没有属性“ y”

然后，我遍历data.itertuples（）来单独打印第一行，以查看其外观，并确认名称仅分配给第一列，而没有分配其他名称。

Pandas(Index=0, x=-0.96, _2=0.87, _3=-0.49, _4=962.17, _5=-566.1, _6=713.4)

数据没有其他问题。 所有值均对应于正确的索引。 只是名称分配不正确，并且只能按名称调用第一列。 我尝试在每个列名的两边加上单引号，这显示出完全相同的错误。 我知道有一些方法可以解决此问题，例如在read_csv函数中分配名称，但是我很好奇问题的实质，以避免再次发生此问题。

Answer 1

创建数据框时，请尝试声明列名称。

df = pd.DataFrame(pd.read_csv(“file.csv”), columns=[“x”, “y”, “z”, “vx”, “vy”, “vz”])

Answer 2

df = pd.read_csv("snap.csv",names =["x", "y", "z", "vx", "vy", "vz"])

Pandas.read_csv无法读取完整标题

问题描述

2 个解决方案

解决方案1
1 已采纳 2018-09-20 04:10:53

解决方案2
0 2018-09-20 04:15:44

Pandas.read_csv无法读取完整标题

问题描述

2 个解决方案

解决方案1 1 已采纳 2018-09-20 04:10:53

解决方案2 0 2018-09-20 04:15:44

解决方案1
1 已采纳 2018-09-20 04:10:53

解决方案2
0 2018-09-20 04:15:44