[英]create a pandas dataframe from xlsx file
我有一個xlsx文件,其中包含期刊摘要,作者,標題欄。 我正在嘗試從數據中加載數據幀以進行進一步分析,但遇到諸如編碼,內存緩沖區問題之類的錯誤。 然后,我嘗試僅加載作者專欄,但錯誤相同。 有人可以提出解決方案嗎?
樣本數據集
作者
{'Oliver Jonas':'麻省理工學院,馬薩諸塞州劍橋。'}
{'Jia-Ren Lin':'哈佛醫學院,馬薩諸塞州波士頓;','Benjamin Izar':'Dana-Farber癌症研究所,哈佛大學和麻省理工學院,馬薩諸塞州波士頓;','Daniel Treacy':'達納·法伯癌症研究所,馬薩諸塞州波士頓;”,“馬克·沃茲沃思”
我嘗試了以下方法:
文件authors.xlsx
:
請注意,我使用LibreOffice Calc編輯表,但是我將文檔另存為.xlsx
然后,我使用pandas.read_excel進行閱讀:
import pandas as pd df = pd.read_excel('authors.xlsx')
然后,您可以按列查詢數據框,從而正確返回值:
在: df['Name']
出: 0 Jia-Ren Lin 1 Benjamin Izar 2 Daniel Treacy Name: Name, dtype: object
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.