簡體   English   中英

如何將逗號分隔值 TXT 轉換為用於機器學習的 CSV

[英]How to turn a comma seperated value TXT into a CSV for machine learning

如何將這種格式的 TXT 文件轉換為 CSV 文件?

Date,Open,high,low,close  
1/1/2017,1,2,1,2  
1/2/2017,2,3,2,3  
1/3/2017,3,4,3,4  

我確定你能看懂? 它已經有逗號分隔的值。 我嘗試使用 numpy。

>>> import numpy as np
>>> table = np.genfromtxt("171028 A.txt", comments="%")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1551, in genfromtxt
    fhd = iter(np.lib._datasource.open(fname, 'rb'))
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 151, in open
    return ds.open(path, mode)
  File "C:\Users\Smith\AppData\Local\Continuum\anaconda3\lib\site-packages\numpy\lib\_datasource.py", line 501, in open
    raise IOError("%s not found." % path)
OSError: 171028 A.txt not found.

我有 (S&P) 500 個 txt 文件來執行此操作。

您可以使用csv模塊。 您可以在此處找到更多信息。

import csv

txt_file = 'mytext.txt'
csv_file = 'mycsv.csv'

in_txt = csv.reader(open(txt_file, "r"), delimiter=',')
out_csv = csv.writer(open(csv_file, 'w+'))

out_csv.writerows(in_txt)

根據@dclarke 的評論,檢查運行代碼的目錄。 當您對調用進行編碼時,該文件必須位於該目錄中。 當我把它放在那里時,代碼運行沒有錯誤(盡管結果表是一行有四個nan值)。 當我將文件移到別處時,我會很好地重現您的錯誤。

將文件移動到本地,添加到文件的本地鏈接,或更改程序中的文件名以使用文件的正確路徑(相對或絕對)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM