[英]How to turn a comma seperated value TXT into a CSV for machine learning
如何将这种格式的 TXT 文件转换为 CSV 文件?
Date,Open,high,low,close
1/1/2017,1,2,1,2
1/2/2017,2,3,2,3
1/3/2017,3,4,3,4
我确定你能看懂? 它已经有逗号分隔的值。 我尝试使用 numpy。
>>> import numpy as np
>>> table = np.genfromtxt("171028 A.txt", comments="%")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1551, in genfromtxt
fhd = iter(np.lib._datasource.open(fname, 'rb'))
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 151, in open
return ds.open(path, mode)
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 501, in open
raise IOError("%s not found." % path)
OSError: 171028 A.txt not found.
我有 (S&P) 500 个 txt 文件来执行此操作。
您可以使用csv
模块。 您可以在此处找到更多信息。
import csv
txt_file = 'mytext.txt'
csv_file = 'mycsv.csv'
in_txt = csv.reader(open(txt_file, "r"), delimiter=',')
out_csv = csv.writer(open(csv_file, 'w+'))
out_csv.writerows(in_txt)
根据@dclarke 的评论,检查运行代码的目录。 当您对调用进行编码时,该文件必须位于该目录中。 当我把它放在那里时,代码运行没有错误(尽管结果表是一行有四个nan
值)。 当我将文件移到别处时,我会很好地重现您的错误。
将文件移动到本地,添加到文件的本地链接,或更改程序中的文件名以使用文件的正确路径(相对或绝对)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.