繁体   English   中英

从xlsx文件创建熊猫数据框

[英]create a pandas dataframe from xlsx file

我有一个xlsx文件,其中包含期刊摘要,作者,标题栏。 我正在尝试从数据中加载数据帧以进行进一步分析,但遇到诸如编码,内存缓冲区问题之类的错误。 然后,我尝试仅加载作者专栏,但错误相同。 有人可以提出解决方案吗?

样本数据集

作者

{'Oliver Jonas':'麻省理工学院,马萨诸塞州剑桥。'}

{'Jia-Ren Lin':'哈佛医学院,马萨诸塞州波士顿;','Benjamin Izar':'Dana-Farber癌症研究所,哈佛大学和麻省理工学院,马萨诸塞州波士顿;','Daniel Treacy':'达纳·法伯癌症研究所,马萨诸塞州波士顿;”,“马克·沃兹沃思”

我尝试了以下方法:

文件authors.xlsx

作者

请注意,我使用LibreOffice Calc编辑表,但是我将文档另存为.xlsx

然后,我使用pandas.read_excel进行阅读:

import pandas as pd df = pd.read_excel('authors.xlsx')

然后,您可以按列查询数据框,从而正确返回值:

在: df['Name']

出: 0 Jia-Ren Lin 1 Benjamin Izar 2 Daniel Treacy Name: Name, dtype: object

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM