簡體   English   中英

分析來自 Pandas 中多個 .txt 文件的數據

[英]Analyzing data from multiple .txt files in pandas

我有 1000 多個文本文件。 每個都有日期(我制作了索引)和股票價格(第 0 列)。 我創建了代碼來查找單個文件的價格的移動平均線,以及價格和移動平均線之間的滾動差異。 我想為每個文件創建代碼來執行此操作。 我必須成組上傳它們,因為一次上傳它們會占用太多內存。

我想我將不得不使用 for 循環來遍歷文件並找到每個文件的指標。 但是我該怎么做呢? 如何將所有文件上傳到一個組中,比如說,將它們分組到一個變量中,然后創建一個循環來查找每個文件的移動平均線和價格差異?

編輯:我正在使用 numpy、pandas 和 matplotlib。 我還希望能夠找到與移動平均線相差最大的股票。

任何幫助將不勝感激

如果您只想遍歷給定文件夾中的所有輸入文件,您可能需要嘗試os.listdir()來獲取文件名列表,然后您可以按順序處理這些文件名。 如果您的文件分布在文件夾層中,您可以使用os.walk()來遍歷目錄。 您可以在此處找到有關這些方法的信息: https : //docs.python.org/3/library/os.html

這 1000 個文件有多大? 如果它們每個都有幾 MB,只是猜測,將所有文件合並到一個文件中,您可以對它做任何想做的事情。

import pandas as pd
import csv
import glob
import os

#os.chdir("C:\\Users\\Excel\\Desktop\\test\\")
results = pd.DataFrame([])
filelist = glob.glob("C:\\your_path\\*.csv")
#dfList=[]
for filename in filelist:
    print(filename)  
    namedf = pd.read_csv(filename, skiprows=0, index_col=0)
    results = results.append(namedf)

results.to_csv('C:\\your_path\\CombinedFile.csv')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM