繁体   English   中英

Python脚本,用于对文件夹中的所有文件运行命令

[英]Python Script to run a command over all files in a folder

为了将pdf转换为文本,我使用以下命令:

pdf2txt.py -o text.txt example.pdf # It will convert example.pdf to text.txt

但我有超过1000个pdf文件,我需要先转换为文本文件,然后进行分析。

有没有办法可以使用此命令迭代pdf文件并转换所有这些文件?

我建议你有一个shell脚本:

for f (*.pdf) {pdf2txt.py -o $f $f.txt}

然后使用python读取所有.txt文件以进行分析。

仅使用python转换:

from subprocess import call
import glob

for pdf_file in glob.glob('*.pdf'): 
    call(["pdf2txt.py", "-o", pdf_file, pdf_file[:-3]+"txt"])

我的win1o操作系统上的python代码出错了(OSError:[WinError 193]%1不是有效的Win32应用程序),for循环应该是:

for pdf_file in glob.glob('*.pdf'):
    call(['python.exe','pdf2txt.py','-o',pdf_file[:-3]+'txt',pdf_file])

注意,文件i / o的参数是相反的,如果你保持相同的顺序,你的文件将被空文件覆盖......

还要感谢Gurupad Hegde,告诉我隐藏文件的方法,它有很多帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM