簡體   English   中英

Read.xls 文件 Python pandas read_excel 不工作,說它是一個.xlsb 文件

[英]Read .xls file with Python pandas read_excel not working, says it is a .xlsb file

我正在嘗試使用 read_excel python pandas function 讀取 Apache Airflow 保存在 NAS 文件夾中的幾個.xls 文件。

這是我正在使用的代碼:

df = pd.read_excel('folder/sub_folder_1/sub_folder_2/file_name.xls', sheet_name=April, usecols=[0,1,2,3], dtype=str, engine='xlrd')

這工作了一段時間,但最近我在其中幾個文件中遇到了這個錯誤:

Excel 2007 xlsb 文件; 不支持

[...]

xlrd.biffh.XLRDError: Excel 2007 xlsb 文件; 不支持

這些文件顯然是 .xls 文件,但我的代碼似乎將它們檢測為不受支持的 .xlsb 文件。 我更喜歡一種方法來指定它們是 .xls 文件,或者一種讀取 xlsb 文件的方法。

不確定這是否相關,但這些文件由外部團隊更新,他們可能在我不知情的情況下修改了這些文件的某些參數,但我認為如果是這種情況,我會得到一個不同的錯誤。

嘗試:

import openpyxl

xls = pd.ExcelFile('data.xls', engine='openpyxl')
df = pd.read_excel(xls)

XLRD 最近刪除了一些 excel 數據類型的讀取能力,比如 xlxs

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM