[英]How to edit all excel file in a folder one after another with python?
[英]How to read, edit, and save as another excel file in Python?
我有一个 excel 文件,其中包含多个工作表(工作表 1、工作表 2、工作表 3、工作表 4 等)。 我想使用 python 进行一些格式更改,并将这些编辑的文件另存为带有多张纸的单独 excel 文件。
第 1 步:读取包含多张工作表的文件
第 2 步:在工作表中进行更改
第 3 步:将更改保存到包含多个工作表的 excel 文件
到目前为止我尝试了什么?
import pandas as pd
import pandas.io.formats.style
import os
from pandas import ExcelWriter
import numpy as np
import xlsxwriter
from itertools import cycle
from xlsxwriter.utility import xl_rowcol_to_cell
df = pd.ExcelFile('data.xlsx')
for i in df.sheet_names:
# make the required changes
writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')
df.to_excel(writer, sheet_name= i , startrow=1 , startcol=0, header=False, index=False, encoding='utf8')
workbook = writer.book
worksheet = writer.sheets[i]
data_format1 = workbook.add_format({'bg_color': '#F1EEEE'})
data_format2 = workbook.add_format({'bg_color': '#FFFFFF'})
formats = cycle([data_format1, data_format2])
for row, value in enumerate(df):
data_format = next(formats)
worksheet.set_row(row, cell_format=data_format)
worksheet.write(row, 0, value)
format_header = workbook.add_format()
format_header.set_bold()
format_header.set_border()
format_header.set_bg_color('gray')
format_header.set_font_color('white')
format_data = workbook.add_format()
#worksheet.set_column('A:Z', 20, format_data)
worksheet.set_row(0, 20, format_header)
# Write the header manually
for colx, value in enumerate(df.columns.values):
worksheet.write(0, colx, value)
worksheet.autofilter(0, 0, df.shape[0], df.shape[1])
writer.save()
我无法保存多张工作表,只保存了第一张工作表。 我怎么做?
当您在 for 循环中调用它时,您会在第一次迭代时关闭文件:
writer.save()
你必须在你的 for 循环之外调用它
您必须将pd.ExcelWriter
移到循环之外,并且只要循环结束就调用writer.save()
一次:
writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')
for i in df.sheet_names:
...
...
...
worksheet.autofilter(0, 0, df.shape[0], df.shape[1])
writer.save()
此外,我认为您应该以不同的方式使用ExcelFile
(至少如果您使用openpyxl
):
exc = pd.ExcelFile('data.xlsx', engine='openpyxl')
writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')
for i in exc.sheet_names:
df = exc.parse(i)
...
...
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.