繁体   English   中英

如何从没有列的杂乱无章的excel文件中提取具体数据)

[英]How to extract the specific data from the unorganized excel file without columns)

我达到了我的极限,我的头发越来越稀疏。 我真的需要你的帮助。

1.尝试

我想从一个文件夹中的*.xlsx中提取包含特定单词“ Super Banana ”的数据行。

这是文件图片。 [1]: https://i.stack.imgur.com/Cb3yD.png

2.问题

  • 此杂乱无章的 excel 文件中没有列。 有很多文件,我无法手动将列添加到所有文件。

    我正在寻找提取方法:

  1. 包含关键词“超级香蕉”的行

    或者

  2. 包含关键字的行之前和之后的行

https://i.stack.imgur.com/Cb3yD.png

  • A1标题“Monday Shopping List 2020”将更改(Monday Shopping List 2020,Monday Shopping List 2021...)

3. 我的代码

import glob

files = glob.glob('*.xlsx')
print(files)

import pandas as pd
for file in files:
    df = pd.read_excel(file).fillna(value = 0)
    for row in df.values:
        data = df[df[''].str.contains('Super Banana',na=False)]
        data.to_excel('excel-data_find.xlsx', encoding='utf-8')
        print(data)
        print('Data was extracted')

使用正确的文件路径。 示例: df = pd.read_excel('C:\\Users\\file.xlsx').fillna(value = 0)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM