簡體   English   中英

從xlsx文件創建熊貓數據框

[英]create a pandas dataframe from xlsx file

我有一個xlsx文件,其中包含期刊摘要,作者,標題欄。 我正在嘗試從數據中加載數據幀以進行進一步分析,但遇到諸如編碼,內存緩沖區問題之類的錯誤。 然后,我嘗試僅加載作者專欄,但錯誤相同。 有人可以提出解決方案嗎?

樣本數據集

作者

{'Oliver Jonas':'麻省理工學院,馬薩諸塞州劍橋。'}

{'Jia-Ren Lin':'哈佛醫學院,馬薩諸塞州波士頓;','Benjamin Izar':'Dana-Farber癌症研究所,哈佛大學和麻省理工學院,馬薩諸塞州波士頓;','Daniel Treacy':'達納·法伯癌症研究所,馬薩諸塞州波士頓;”,“馬克·沃茲沃思”

我嘗試了以下方法:

文件authors.xlsx

作者

請注意,我使用LibreOffice Calc編輯表,但是我將文檔另存為.xlsx

然后,我使用pandas.read_excel進行閱讀:

import pandas as pd df = pd.read_excel('authors.xlsx')

然后,您可以按列查詢數據框,從而正確返回值:

在: df['Name']

出: 0 Jia-Ren Lin 1 Benjamin Izar 2 Daniel Treacy Name: Name, dtype: object

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM