[英]Issue with reading partial header CSV using pandas.read_csv
我正在尝试使用pandas.read_csv读取csv文件,而文件头不完整,即,仅某些列具有名称,而另一些则为空。
当使用.iloc读取数据帧时,我只会得到标题没有任何名称的列。 一些列没有名称的原因是该列的大小是可变的,并且我没有为每个列分配名称。
这是代码,输入文件和输出的示例
dataframe = pandas.read_csv('filename.csv', sep = ",", header = 0)
dataframe = dataframe.iloc[::]
dataset = dataframe.values[:,0:]
输入文件
A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15
数据集输出
dataset = [[1,2,3][5,6,7][9,10,11][13,14,15]]
如何获取数据框以使用整个数组(不包含标题)?
我认为您需要.values
来返回numpy ndarray。
from io import StringIO
csv_file = StringIO("""A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15""")
df = pd.read_csv(csv_file,sep='\s',engine='python')
df.values
输出:
array([[ 1, 2, 3],
[ 5, 6, 7],
[ 9, 10, 11],
[13, 14, 15]])
为什么在加载csv文件时不跳过= 1 ?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.