[英]Python PDFMerger Too Slow
我正在使用 PyPDF2 中的 PDFMerger。 我的程序基本上是讀取文件夾中的所有 PDF 並將它們合並為一個。 我用 15 個 PDF 文件進行了測試,每個文件大小為 500kb,效果非常好。 整個過程在一秒鍾內完成。 然而,當我嘗試大量處理時,過程花費的時間比我預期的要長。 我曾嘗試合並 1000 個文件,每個文件都是 500kb,讀取和附加所有這些 PDF 總共花費了 3 秒,但是在編寫 PDF 時,它花費了 67 秒。 我已經嘗試了 2 個級別的合並(500 合並為 1,其他 500 合並為其他 1,然后合並最后的 2),但持續時間大致相同。 有什么辦法可以加快這個寫作過程嗎?
我在下面添加我的代碼。
merger = PdfMerger()
for pdf in dirs:
if pdf.endswith('pdf'):
merger.append(pdf)
merger.write(filename)
merger.close()
這是一個比答案更長的評論。
我剛剛使用最新版本的 PyPDF2 嘗試了這個:
from PyPDF2 import PdfReader, PdfWriter
import time
reader =PdfReader("a-two-page-doc.pdf")
writer = PdfWriter()
for i in range(1000):
writer.append(reader)
t0 = time.time()
with open("out-2000-pages.pdf", "wb") as fp:
writer.write(fp)
t1 = time.time()
print(f"{t1-t0:.2f}s")
這在我的機器上花費了大約 0.67 秒。
您使用的是哪個版本的 PyPDF2? 哪個版本的 Python? 是否有關於特定 PDF 的內容? 單個PDF有多大? 您是否啟用了某些壓縮功能?
沒有更多的細節,沒有人能夠幫助你。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.