[英]Why pandas read_excel not reading correctly xls file?
我只是想用下面的代碼用 pandas 打開 xls 文件:
import pandas as pd
frame = pd.read_excel('15_6z_12N_11.xlsx', skiprows=3)
df = pd.DataFrame(frame)
#pd.read_excel('your_excel.xlsx', , skip_blank_lines=False)
print(df)
回報是
Unnamed: 0 185 ... Unnamed: 254 Unnamed: 255
0 NaN NaN ... NaN NaN
1 NaN NaN ... NaN NaN
2 NaN NaN ... NaN NaN
3 NaN NaN ... NaN NaN
4 NaN NaN ... NaN NaN
.. ... ... ... ... ...
993 NaN NaN ... NaN NaN
994 NaN NaN ... NaN NaN
995 NaN NaN ... NaN NaN
996 NaN NaN ... NaN NaN
997 NaN NaN ... NaN NaN
當我的文件包含以下數據時:來自 xls 的數據
知道為什么 output 不正確嗎? 謝謝
這是 xls 文件但很抱歉它是俄語
嘗試這個:
df = pd.read_excel('15_6z_12N_11.xlsx', header=[0,1,2]) #Read file, use 3 rows as header
首先創建DataFrame
並指定 sheetname,省略前 3 行,后 3 行轉換為MultiIndex
:
df = pd.read_excel('15_6z_12N_11.xls', sheet_name='PRINT', skiprows=3, header=[0,1,2])
Multiindex
然后可以通過刪除Unnamed
的字符串來展平多索引:
df.columns = ['_'.join(y for y in x if not 'Unnamed' in y) for x in df.columns.tolist()]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.