簡體   English   中英

導入多個Excel文件以進行數據分析

[英]Importing multiple excel files for data analysis

我有幾行代碼和一個小難題,因此我出於分析目的編寫了這段代碼,它占用了一個excel文件,使用熊貓將其讀取為Dataframme,如果我沒記錯的話,我是新手編碼,然后將文件分成5的倍數進行裝箱。盡管如此,我仍然可以將其與一個文件一起使用,但是我想知道如何做才能使其讀取多個excel文件對每個文件應用相同的裝箱並輸出每個被分析的文件文件。 代碼是:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import openpyxl
from pandas import ExcelWriter

data = pd.read_excel('/Users/user/Desktop/Data/Book1.xlsx')
counts, bins, patches = plt.hist(data.values, bins=range(0, 
int(max(data.values)+5), 5))
df = pd.DataFrame({'bin_leftedge': bins[:-1], 'count': counts})
plt.title('Data')
plt.xlabel('Neuron')
plt.ylabel('# of Spikes')
plt.show()

writer = pd.ExcelWriter('/Users/jorge/Desktop/Data/output.xlsx')
df.to_excel(writer,'Sheet2')
writer.save()

另外,最終目標是能夠讓代碼確定所有輸入和分析的excel文件的最大值,並讓代碼保存所有這些文件的最大值(無論是2、3、5、27個excel文件) ),並將每個excel文件與最大代碼進行比較,請提供任何幫助。 再次感謝您。

從...開始:

import os
import re
                                                                                                                    for files in os.listdir(r"/Users/user/Desktop/Data"):
    if re.search(r".*.xlsx", files):
        data = pd.read_excel("//Users//jorge//Desktop//Data/{0}".format(files))  

....將您的代碼放在這里...

這將循環遍歷dir中的所有ecel文件,您可以重新調整所需的操作

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM