簡體   English   中英

將數據框循環寫入多個Excel文件

[英]Write the dataframe in loop to Multiple Excel File

我有500個excel文件,我必須從每個文件中跳過開始的4行並選擇幾列。 我可以為具有特定列的每個文件創建新的Excel文件,也可以在SQL Server中推送數據。

我需要創建一個可以讀取所有文件並執行所需過程並以excel或SQL格式輸出的函數。

使用os庫來處理文件系統很方便。
函數clean_one來自您的代碼,但有少量更改。 功能clean_all適用clean_one在所有文件root目錄下(這是在我的代碼“os.getcwd` [當前工作目錄):

import os
import pandas as pd

def clean_one(path, n):
    df = pd.read_excel(path, skiprows = 4)
    col_list = ['Emp Code', 'Emp Name', 'Net Salary', 'Gross Earnings', 'Provident Fund',
                'Provident Fund_A', 'Profession Tax', 'ESIC Deduction', 'ESIC Deduction_A',
                'Gross Deductions', 'Net Salary','Salary Bank', 'Salary Account No',
                'IFSC Code', 'PAN', 'Location', 'PF_Membership_No', 'State For PT']
    df.to_excel('File_%d.xlsx' % n, columns = col_list)

def clean_all(root):
    for n, filepath in enumerate(os.listdir(root)):
        path = os.path.join(root, filepath)
        clean_one(path, n)

if __name__ == "__main__":
    root = os.getcwd() # Replace it with necessary directory
    clean_all(root)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM