繁体   English   中英

使用pandas.read_csv读取部分标题CSV的问题

[英]Issue with reading partial header CSV using pandas.read_csv

我正在尝试使用pandas.read_csv读取csv文件,而文件头不完整,即,仅某些列具有名称,而另一些则为空。
当使用.iloc读取数据帧时,我只会得到标题没有任何名称的列。 一些列没有名称的原因是该列的大小是可变的,并且我没有为每个列分配名称。

这是代码,输入文件和输出的示例

dataframe = pandas.read_csv('filename.csv', sep = ",", header = 0)
dataframe = dataframe.iloc[::]
dataset = dataframe.values[:,0:]

输入文件

A B C           
3 5 0      1    2   3

3   5   4      5    6   7

3   5   8      9    10  11

3   5   12     13   14  15

数据集输出

dataset = [[1,2,3][5,6,7][9,10,11][13,14,15]]

如何获取数据框以使用整个数组(不包含标题)?

我认为您需要.values来返回numpy ndarray。

from io import StringIO

csv_file = StringIO("""A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15""")

df = pd.read_csv(csv_file,sep='\s',engine='python')
df.values

输出:

array([[ 1,  2,  3],
       [ 5,  6,  7],
       [ 9, 10, 11],
       [13, 14, 15]])

为什么在加载csv文件时不跳过= 1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM