繁体   English   中英

如何使用 Python 从多个文本文件中提取数据到 Excel? (每张纸一个文件的数据)

[英]How do I extract data from multiple text files to Excel using Python? (One file's data per sheet)

到目前为止,我的代码从文本文件中读取并导出到 Excel 我有:

import glob

data = {}
for infile in glob.glob("*.txt"):
    with open(infile) as inf:
        data[infile] = [l[:-1] for l in inf] 

with open("summary.xls", "w") as outf:
    outf.write("\t".join(data.keys()) + "\n")
    for sublst in zip(*data.values()):
        outf.write("\t".join(sublst) + "\n")


但是,当我运行它时,Excel 给我一个错误提示,

“文件无法打开,因为:文档顶层无效。第 1 行,位置 1.outputgooderr.txt outputbaderr.txt.fixed_inv.txt

注意:outputgooderr.txt、outputbaderr.txt.、fixed_inv.txt 是我希望导出到 Excel 的文本文件的名称,每张纸一个文件。

当我只有一个文件供程序读取时,它能够提取数据。 不幸的是,这不是我想要的,因为我有多个文件。

请让我知道我可以解决这个问题的任何方法。 我是一个编程初学者,非常感谢任何建议! 谢谢你。

如果您不反对将输出的 excel 文件作为 .xlsx 而不是 .xls,我建议您使用Pandas的一些功能。 特别是pandas.read_csv()DataFrame.to_excel()

我已经提供了一个完全可重现的示例,说明您可能会如何执行此操作。 请注意,我在测试的前 3 行中创建了 2 个 .txt 文件。

import pandas as pd
import numpy as np
import glob

# Creating a dataframe and saving as test_1.txt/test_2.txt in current directory
# feel free to remove the next 3 lines if yo want to test in your directory
df = pd.DataFrame(np.random.randn(10, 3), columns=list('ABC'))
df.to_csv('test_1.txt', index=False)
df.to_csv('test_2.txt', index=False)

txt_list = [] # empty list
sheet_list = [] # empty list

# a for loop through filenames matching a specified pattern (.txt) in the current directory
for infile in glob.glob("*.txt"): 
    outfile = infile.replace('.txt', '') #removing '.txt' for excel sheet names
    sheet_list.append(outfile) #appending for excel sheet name to sheet_list
    txt_list.append(infile) #appending for '...txt' to txtt_list

writer = pd.ExcelWriter('summary.xlsx', engine='xlsxwriter')

# a for loop through all elements in txt_list
for i in range(0, len(txt_list)):
    df = pd.read_csv('%s' % (txt_list[i])) #reading element from txt_list at index = i 
    df.to_excel(writer, sheet_name='%s' % (sheet_list[i]), index=False) #reading element from sheet_list at index = i 





声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

粤ICP备18138465号  © 2020-2024 STACKOOM.COM