[英]Python Script to run a command over all files in a folder
為了將pdf轉換為文本,我使用以下命令:
pdf2txt.py -o text.txt example.pdf # It will convert example.pdf to text.txt
但我有超過1000個pdf文件,我需要先轉換為文本文件,然后進行分析。
有沒有辦法可以使用此命令迭代pdf文件並轉換所有這些文件?
我建議你有一個shell腳本:
for f (*.pdf) {pdf2txt.py -o $f $f.txt}
然后使用python讀取所有.txt
文件以進行分析。
僅使用python轉換:
from subprocess import call
import glob
for pdf_file in glob.glob('*.pdf'):
call(["pdf2txt.py", "-o", pdf_file, pdf_file[:-3]+"txt"])
我的win1o操作系統上的python代碼出錯了(OSError:[WinError 193]%1不是有效的Win32應用程序),for循環應該是:
for pdf_file in glob.glob('*.pdf'):
call(['python.exe','pdf2txt.py','-o',pdf_file[:-3]+'txt',pdf_file])
注意,文件i / o的參數是相反的,如果你保持相同的順序,你的文件將被空文件覆蓋......
還要感謝Gurupad Hegde,告訴我隱藏文件的方法,它有很多幫助!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.