分析來自 Pandas 中多個 .txt 文件的數據

Question

我有 1000 多個文本文件。 每個都有日期（我制作了索引）和股票價格（第 0 列）。 我創建了代碼來查找單個文件的價格的移動平均線，以及價格和移動平均線之間的滾動差異。 我想為每個文件創建代碼來執行此操作。 我必須成組上傳它們，因為一次上傳它們會占用太多內存。

我想我將不得不使用 for 循環來遍歷文件並找到每個文件的指標。 但是我該怎么做呢？ 如何將所有文件上傳到一個組中，比如說，將它們分組到一個變量中，然后創建一個循環來查找每個文件的移動平均線和價格差異？

編輯：我正在使用 numpy、pandas 和 matplotlib。 我還希望能夠找到與移動平均線相差最大的股票。

任何幫助將不勝感激

Answer 1

如果您只想遍歷給定文件夾中的所有輸入文件，您可能需要嘗試os.listdir()來獲取文件名列表，然后您可以按順序處理這些文件名。 如果您的文件分布在文件夾層中，您可以使用os.walk()來遍歷目錄。 您可以在此處找到有關這些方法的信息： https : //docs.python.org/3/library/os.html

Answer 2

這 1000 個文件有多大？ 如果它們每個都有幾 MB，只是猜測，將所有文件合並到一個文件中，您可以對它做任何想做的事情。

import pandas as pd
import csv
import glob
import os

#os.chdir("C:\\Users\\Excel\\Desktop\\test\\")
results = pd.DataFrame([])
filelist = glob.glob("C:\\your_path\\*.csv")
#dfList=[]
for filename in filelist:
    print(filename)  
    namedf = pd.read_csv(filename, skiprows=0, index_col=0)
    results = results.append(namedf)

results.to_csv('C:\\your_path\\CombinedFile.csv')

分析來自 Pandas 中多個 .txt 文件的數據

問題描述

2 個解決方案

解決方案1
1 2020-02-12 21:51:55

解決方案2
0 2020-02-13 16:46:46

分析來自 Pandas 中多個 .txt 文件的數據

問題描述

2 個解決方案

解決方案1 1 2020-02-12 21:51:55

解決方案2 0 2020-02-13 16:46:46

解決方案1
1 2020-02-12 21:51:55

解決方案2
0 2020-02-13 16:46:46