[英]How to load a CSV into IPython notebook
我有一个csv文件准备加载到我的python代码,但是,我想加载到以下格式:
data = [[A,B,C,D],
[A,B,C,D],
[A,B,C,D],
]
我如何加载一个可读作为numpy数组的.csv文件? 例如,简单地使用以前的教程会破坏使用:
data = np.array(data)
如果做不到这一点,我只想上传我的csv文件(例如'dual-Cored.csv'作为data = dual-Cored.csv)
最简单的解决方案就是:
import numpy as np
data = np.loadtxt("myfile.csv")
只要数据可以转换为float
并且每行具有相同数量的列,就可以了。
如果数据在某些列中无法转换为float
,则可以为其编写自己的转换器。 请参阅numpy.loadtxt
文档。 它非常灵活。
如果您的CVS看起来像这样:
A,B,C,D
A,B,C,D
A,B,C,D
A,B,C,D
然后
import csv
with open(filename, 'rb') as f:
data = list(csv.reader(f))
会使data
等于
[['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D']]
作为一个小例子,我有一些文件data.csv
其中包含以下内容。
A B C D
1,2,3,4
W,X,Y,Z
5,6,7,8
with open('data.csv', 'r') as f:
data = [i.split(",") for i in f.read().split()]
print data
产量
[['A', 'B', 'C', 'D'],
['1', '2', '3', '4'],
['W', 'X', 'Y', 'Z'],
['5', '6', '7', '8']]
我假设你的意思是将所有数据点作为整数或浮点数。
首先我写了一些示例数据:
with open('dual-Cored.csv', 'w') as f:
f.write('1,2,3,4\n5,6,7,8\n9,10,11,12')
现在我正在读回样本数据
with open('dual-Cored.csv', 'rU') as f:
c = csv.reader(f)
for l in c:
print list(map(int, l))
哪个印刷品:
[1, 2, 3, 4]
[5, 6, 7, 8]
[9, 10, 11, 12]
我建议您在Python教程中阅读一些数据类型,其中讨论了字符串和数字类型之间的区别。
要使用csv模块读入numpy数组:
import numpy
with open('dual-Cored.csv', 'rU') as f:
c = csv.reader(f)
ar = numpy.array(list(c), dtype=int)
和ar
现在返回:
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
或直接使用numpy.genfromtxt
函数(您需要指定分隔符):
numpy.genfromtxt('dual-Cored.csv', delimiter=',')
收益:
array([[ 1., 2., 3., 4.],
[ 5., 6., 7., 8.],
[ 9., 10., 11., 12.]])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.