繁体   English   中英

如何将逗号分隔值 TXT 转换为用于机器学习的 CSV

[英]How to turn a comma seperated value TXT into a CSV for machine learning

如何将这种格式的 TXT 文件转换为 CSV 文件?

Date,Open,high,low,close  
1/1/2017,1,2,1,2  
1/2/2017,2,3,2,3  
1/3/2017,3,4,3,4  

我确定你能看懂? 它已经有逗号分隔的值。 我尝试使用 numpy。

>>> import numpy as np
>>> table = np.genfromtxt("171028 A.txt", comments="%")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1551, in genfromtxt
    fhd = iter(np.lib._datasource.open(fname, 'rb'))
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 151, in open
    return ds.open(path, mode)
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 501, in open
    raise IOError("%s not found." % path)
OSError: 171028 A.txt not found.

我有 (S&P) 500 个 txt 文件来执行此操作。

您可以使用csv模块。 您可以在此处找到更多信息。

import csv

txt_file = 'mytext.txt'
csv_file = 'mycsv.csv'

in_txt = csv.reader(open(txt_file, "r"), delimiter=',')
out_csv = csv.writer(open(csv_file, 'w+'))

out_csv.writerows(in_txt)

根据@dclarke 的评论,检查运行代码的目录。 当您对调用进行编码时,该文件必须位于该目录中。 当我把它放在那里时,代码运行没有错误(尽管结果表是一行有四个nan值)。 当我将文件移到别处时,我会很好地重现您的错误。

将文件移动到本地,添加到文件的本地链接,或更改程序中的文件名以使用文件的正确路径(相对或绝对)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM