繁体   English   中英

如何在 Python 中读取、编辑和另存为另一个 excel 文件?

[英]How to read, edit, and save as another excel file in Python?

我有一个 excel 文件,其中包含多个工作表(工作表 1、工作表 2、工作表 3、工作表 4 等)。 我想使用 python 进行一些格式更改,并将这些编辑的文件另存为带有多张纸的单独 excel 文件。

第 1 步:读取包含多张工作表的文件

第 2 步:在工作表中进行更改

第 3 步:将更改保存到包含多个工作表的 excel 文件

到目前为止我尝试了什么?

import pandas as pd
import pandas.io.formats.style
import os
from pandas import ExcelWriter
import numpy as np
import xlsxwriter
from itertools import cycle

from xlsxwriter.utility import xl_rowcol_to_cell

df = pd.ExcelFile('data.xlsx')

for i in df.sheet_names:
    # make the required changes
    writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')  
    df.to_excel(writer, sheet_name= i , startrow=1 , startcol=0, header=False, index=False, encoding='utf8')  
    workbook  = writer.book
    worksheet = writer.sheets[i]

    data_format1 = workbook.add_format({'bg_color': '#F1EEEE'})
    data_format2 = workbook.add_format({'bg_color': '#FFFFFF'})

    formats = cycle([data_format1, data_format2])

    for row, value in enumerate(df):
        data_format = next(formats)
        worksheet.set_row(row, cell_format=data_format)
        worksheet.write(row, 0, value)

    format_header = workbook.add_format()
    format_header.set_bold()
    format_header.set_border()
    format_header.set_bg_color('gray')
    format_header.set_font_color('white')

    format_data = workbook.add_format()

    #worksheet.set_column('A:Z', 20, format_data)
    worksheet.set_row(0, 20, format_header)

    # Write the header manually
    for colx, value in enumerate(df.columns.values):
        worksheet.write(0, colx, value)

    worksheet.autofilter(0, 0, df.shape[0], df.shape[1])

    writer.save()

我无法保存多张工作表,只保存了第一张工作表。 我怎么做?

当您在 for 循环中调用它时,您会在第一次迭代时关闭文件:

 writer.save()

你必须在你的 for 循环之外调用它

您必须将pd.ExcelWriter移到循环之外,并且只要循环结束就调用writer.save()一次:

writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')
for i in df.sheet_names:
    ...
    ...
    ...
    worksheet.autofilter(0, 0, df.shape[0], df.shape[1])
writer.save()

此外,我认为您应该以不同的方式使用ExcelFile (至少如果您使用openpyxl ):

exc = pd.ExcelFile('data.xlsx', engine='openpyxl')

writer = pd.ExcelWriter('edited_file.xlsx', engine='xlsxwriter', options={'strings_to_numbers': True}, date_format='mmmm dd yyyy')
for i in exc.sheet_names:
    df = exc.parse(i)
    ...
    ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM