簡體   English   中英

從第 5 行開始讀取 excel 到 python 數據框並包括標題

[英]reading excel to a python data frame starting from row 5 and including headers

如何將excel數據導入python中的數據框。

基本上,當前的 excel 工作簿在打開時會運行一些 vba,它會刷新數據透視表並執行一些其他操作。

然后我希望將數據透視表刷新的結果導入 python 中的數據幀以進行進一步分析。

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

文件的刷新和打開工作正常。 但是我如何從第 5 行的第一張工作表中選擇數據,包括標題到最后一條記錄 n。

您可以使用 pandas 的 ExcelFile parse方法來讀取 Excel 表格,請參閱io docs

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows將忽略前 4 行(即從行索引 4 開始)和其他幾個選項

接受的答案是舊的(如已接受答案的評論中所述)。 現在首選的選項是使用pd.read_excel() 例如:

df = pandas.read_excel('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm'), skiprows=[0,1,2,3,4])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM