[英]How to turn a comma seperated value TXT into a CSV for machine learning
如何將這種格式的 TXT 文件轉換為 CSV 文件?
Date,Open,high,low,close
1/1/2017,1,2,1,2
1/2/2017,2,3,2,3
1/3/2017,3,4,3,4
我確定你能看懂? 它已經有逗號分隔的值。 我嘗試使用 numpy。
>>> import numpy as np
>>> table = np.genfromtxt("171028 A.txt", comments="%")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1551, in genfromtxt
fhd = iter(np.lib._datasource.open(fname, 'rb'))
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 151, in open
return ds.open(path, mode)
File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 501, in open
raise IOError("%s not found." % path)
OSError: 171028 A.txt not found.
我有 (S&P) 500 個 txt 文件來執行此操作。
您可以使用csv
模塊。 您可以在此處找到更多信息。
import csv
txt_file = 'mytext.txt'
csv_file = 'mycsv.csv'
in_txt = csv.reader(open(txt_file, "r"), delimiter=',')
out_csv = csv.writer(open(csv_file, 'w+'))
out_csv.writerows(in_txt)
根據@dclarke 的評論,檢查運行代碼的目錄。 當您對調用進行編碼時,該文件必須位於該目錄中。 當我把它放在那里時,代碼運行沒有錯誤(盡管結果表是一行有四個nan
值)。 當我將文件移到別處時,我會很好地重現您的錯誤。
將文件移動到本地,添加到文件的本地鏈接,或更改程序中的文件名以使用文件的正確路徑(相對或絕對)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.