簡體   English   中英

pd.read_excel 使用 openpyxl 讀取不需要的空單元格

[英]pd.read_excel reading not required empty cells using openpyxl

每當我使用 pd.read_excel() 讀取 a.xlsx 文件時,dataframe 包含許多不需要的空 NaN 單元格。

例如:

在此處輸入圖像描述

使用 read_excel 讀取上表時,應僅包含 30 個單元格(包括表頭和表內的空單元格)。 但是它給了我所有與 NaN 相鄰的空單元格,而我的 dataframe 由於空的 NaN 單元格而在高度和寬度方面要大得多。

我認為這是一個 package 問題。 任何人都可以幫忙嗎?

另一個例子:

pd.read_excel 給出:

在此處輸入圖像描述

我認為這里的問題在於 excel 文檔,因為它具有 null 數據(它們不是空的)。 您可以嘗試使用 pandas dropna function 參數為 (axis=0, how='all', inplace=True) 從 Z6A8064B5DF47945550DZ553C47C55057 中刪除這些行

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM