將數據框循環寫入多個Excel文件

Question

我有500個excel文件，我必須從每個文件中跳過開始的4行並選擇幾列。 我可以為具有特定列的每個文件創建新的Excel文件，也可以在SQL Server中推送數據。

我需要創建一個可以讀取所有文件並執行所需過程並以excel或SQL格式輸出的函數。

Answer 1

使用os庫來處理文件系統很方便。
函數clean_one來自您的代碼，但有少量更改。 功能clean_all適用clean_one在所有文件root目錄下（這是在我的代碼“os.getcwd` [當前工作目錄）：

import os
import pandas as pd

def clean_one(path, n):
    df = pd.read_excel(path, skiprows = 4)
    col_list = ['Emp Code', 'Emp Name', 'Net Salary', 'Gross Earnings', 'Provident Fund',
                'Provident Fund_A', 'Profession Tax', 'ESIC Deduction', 'ESIC Deduction_A',
                'Gross Deductions', 'Net Salary','Salary Bank', 'Salary Account No',
                'IFSC Code', 'PAN', 'Location', 'PF_Membership_No', 'State For PT']
    df.to_excel('File_%d.xlsx' % n, columns = col_list)

def clean_all(root):
    for n, filepath in enumerate(os.listdir(root)):
        path = os.path.join(root, filepath)
        clean_one(path, n)

if __name__ == "__main__":
    root = os.getcwd() # Replace it with necessary directory
    clean_all(root)

將數據框循環寫入多個Excel文件

問題描述

1 個解決方案

解決方案1
0 已采納 2018-06-18 08:10:23

將數據框循環寫入多個Excel文件

問題描述

1 個解決方案

解決方案1 0 已采納 2018-06-18 08:10:23

解決方案1
0 已采納 2018-06-18 08:10:23