繁体   English   中英

在 Pandas 中,read_excel() 中使用的 read_csv() 中的“nrows”相当于什么?

[英]In Pandas, whats the equivalent of 'nrows' from read_csv() to be used in read_excel()?

只想将特定范围的数据从 excel 电子表格(.xlsm 格式,因为它具有宏)导入到 Pandas 数据框中。 是这样做的:

data    = pd.read_excel(filepath, header=0,  skiprows=4, nrows= 20, parse_cols = "A:D")

但似乎 nrows 仅适用于 read_csv() ? read_excel() 的等价物是什么?

如果您知道 Excel 工作表中的行数,则可以使用skip_footer参数读取文件的前n - skip_footer行,其中n是总行数。

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

用法:

data = pd.read_excel(filepath, header=0, parse_cols = "A:D", skip_footer=80)

假设您的 excel 表有 100 行,此行将解析前 20 行。

文档中所述,从 pandas 版本 0.23 开始,这现在是一个内置选项,其功能几乎与 OP 所述完全相同。

编码

data = pd.read_excel(filepath, header=0, skiprows=4, nrows= 20, use_cols = "A:D")

现在将读取excel文件,从第一张工作表中取数据(默认),跳过4行数据,然后以第一行(即工作表的第五行)为标题,将接下来的20行数据读入数据框(第 6-25 行),并且仅使用 A:D 列。 请注意, use_cols 现在是最后一个选项,因为 parse_cols 已被弃用。

我想让(扩展) @Erol 的回答更灵活一些。

假设我们不知道excel表中的总行数:

xl = pd.ExcelFile(filepath)

# parsing first (index: 0) sheet
total_rows = xl.book.sheet_by_index(0).nrows

skiprows = 4
nrows = 20

# calc number of footer rows
# (-1) - for the header row
skipfooter = total_rows - nrows - skiprows - 1

df = xl.parse(0, skiprows=skiprows, skipfooter=skipfooter, parse_cols="A:D") \
       .dropna(axis=1, how='all')

.dropna(axis=1, how='all')将删除所有包含NaN的列

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM