如何使用 python 格式化 excel 文件？

Question

I have a script that scrapes data from list of websites using beautifulSoup package and save in an excel file using pandas and xlsxwriter packages.

我想要的是能夠像列的寬度一樣格式化 excel 文件

但是當我運行腳本時它崩潰並顯示以下錯誤。

AttributeError: 'NoneType' object has no attribute 'write'

代碼：

import pandas as pd

import requests
from bs4 import BeautifulSoup
import xlsxwriter

def scrap_website():
    url_list = ["https://www.bayt.com/en/international/jobs/executive-chef-jobs/",
    "https://www.bayt.com/en/international/jobs/head-chef-jobs/",
    "https://www.bayt.com/en/international/jobs/executive-sous-chef-jobs/"]
    
    joineddd = []
    for url in url_list:
        soup = BeautifulSoup(requests.get(url).content,"lxml")
        links = []
        for a in soup.select("h2.m0.t-regular a"):
            if a['href'] not in links:
                links.append("https://www.bayt.com"+ a['href'])
        
        for link in links:
            s = BeautifulSoup(requests.get(link).content, "lxml") 
            ### update Start ###
            alldd = dict()
            alldd['link'] = link
            dd_div = [i for i in s.select("div[class='card-content is-spaced'] div") 
                    if ('<dd>' in str(i) ) and ( "<dt>" in str(i))]

            for div in dd_div:
                k = div.select_one('dt').get_text(';', True)
                v = div.select_one('dd').get_text(';', True)
                alldd[k] = v
            ### update End  ###    
            joineddd.append(alldd)


# result
        df = pd.DataFrame(joineddd)
        df_to_excel = df.to_excel(r"F:\\AIenv\web_scrapping\\jobDesc.xlsx", index = False, header=True)
        workbook = xlsxwriter.Workbook(df_to_excel)
        worksheet = workbook.add_worksheet()
        worksheet.set_column(0, 0,50)
        workbook.close()

錯誤在哪里以及如何解決？

Answer 1

to_excel function 什么也不返回。 這就是您收到錯誤消息的原因。

# save excel file
excel_file_name = r"jobDesc.xlsx"
df.to_excel(excel_file_name, index = False, header=True)

# open excel file for change col width or something
workbook = xlsxwriter.Workbook(excel_file_name)

基本上，您不能使用xlsxwriter更改現有文件。 有一種方法可以這樣做，但不建議這樣做。 我推薦openpyxl package 而不是這個。 僅供參考， xlsxwriter：有沒有辦法在我的工作簿中打開現有工作表？

Answer 2

要訪問和格式化由to_excel()創建的 Excel 工作簿或工作表，您需要首先創建一個 ExcelWriter object。 像這樣的東西：

import pandas as pd


# Create a Pandas dataframe from some data.
df = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]})

# Create a Pandas Excel writer using XlsxWriter as the engine.
writer = pd.ExcelWriter('pandas_simple.xlsx', engine='xlsxwriter')

# Convert the dataframe to an XlsxWriter Excel object.
df.to_excel(writer, sheet_name='Sheet1', index=False, header=True)

# Get the xlsxwriter objects from the dataframe writer object.
workbook  = writer.book
worksheet = writer.sheets['Sheet1']

# Set the column width.
worksheet.set_column(0, 0, 50)

# Close the Pandas Excel writer and output the Excel file.
writer.save()

Output：

有關更多詳細信息，請參閱使用 Python Pandas 和 XlsxWriter 。

如何使用 python 格式化 excel 文件？

問題描述

代碼：

2 個解決方案

解決方案1
0 2021-03-05 09:29:54

解決方案2
0 已采納 2021-03-05 10:21:00

如何使用 python 格式化 excel 文件？

問題描述

代碼：

2 個解決方案

解決方案1 0 2021-03-05 09:29:54

解決方案2 0 已采納 2021-03-05 10:21:00

解決方案1
0 2021-03-05 09:29:54

解決方案2
0 已采納 2021-03-05 10:21:00