為什么 pandas read_excel 不能正確讀取 xls 文件？

Question

我只是想用下面的代碼用 pandas 打開 xls 文件：

import pandas as pd

frame = pd.read_excel('15_6z_12N_11.xlsx', skiprows=3)
df = pd.DataFrame(frame)
#pd.read_excel('your_excel.xlsx', , skip_blank_lines=False)

print(df)

回報是

     Unnamed: 0  185  ...  Unnamed: 254  Unnamed: 255
0           NaN  NaN  ...           NaN           NaN
1           NaN  NaN  ...           NaN           NaN
2           NaN  NaN  ...           NaN           NaN
3           NaN  NaN  ...           NaN           NaN
4           NaN  NaN  ...           NaN           NaN
..          ...  ...  ...           ...           ...
993         NaN  NaN  ...           NaN           NaN
994         NaN  NaN  ...           NaN           NaN
995         NaN  NaN  ...           NaN           NaN
996         NaN  NaN  ...           NaN           NaN
997         NaN  NaN  ...           NaN           NaN

當我的文件包含以下數據時：來自 xls 的數據

知道為什么 output 不正確嗎？ 謝謝

這是 xls 文件但很抱歉它是俄語

Answer 1

嘗試這個：

df = pd.read_excel('15_6z_12N_11.xlsx', header=[0,1,2]) #Read file, use 3 rows as header

Answer 2

首先創建DataFrame並指定 sheetname，省略前 3 行，后 3 行轉換為MultiIndex ：

df = pd.read_excel('15_6z_12N_11.xls', sheet_name='PRINT', skiprows=3, header=[0,1,2])

Multiindex然后可以通過刪除Unnamed的字符串來展平多索引：

df.columns = ['_'.join(y for y in x if not 'Unnamed' in y) for x in df.columns.tolist()]

為什么 pandas read_excel 不能正確讀取 xls 文件？

問題描述

2 個解決方案

解決方案1
0 2020-05-20 06:37:56

解決方案2
0 已采納 2020-05-20 06:53:19

為什么 pandas read_excel 不能正確讀取 xls 文件？

問題描述

2 個解決方案

解決方案1 0 2020-05-20 06:37:56

解決方案2 0 已采納 2020-05-20 06:53:19

解決方案1
0 2020-05-20 06:37:56

解決方案2
0 已采納 2020-05-20 06:53:19