簡體   English   中英

Python腳本,用於對文件夾中的所有文件運行命令

[英]Python Script to run a command over all files in a folder

為了將pdf轉換為文本,我使用以下命令:

pdf2txt.py -o text.txt example.pdf # It will convert example.pdf to text.txt

但我有超過1000個pdf文件,我需要先轉換為文本文件,然后進行分析。

有沒有辦法可以使用此命令迭代pdf文件並轉換所有這些文件?

我建議你有一個shell腳本:

for f (*.pdf) {pdf2txt.py -o $f $f.txt}

然后使用python讀取所有.txt文件以進行分析。

僅使用python轉換:

from subprocess import call
import glob

for pdf_file in glob.glob('*.pdf'): 
    call(["pdf2txt.py", "-o", pdf_file, pdf_file[:-3]+"txt"])

我的win1o操作系統上的python代碼出錯了(OSError:[WinError 193]%1不是有效的Win32應用程序),for循環應該是:

for pdf_file in glob.glob('*.pdf'):
    call(['python.exe','pdf2txt.py','-o',pdf_file[:-3]+'txt',pdf_file])

注意,文件i / o的參數是相反的,如果你保持相同的順序,你的文件將被空文件覆蓋......

還要感謝Gurupad Hegde,告訴我隱藏文件的方法,它有很多幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM