簡體   English   中英

Python PDFMerger 太慢

[英]Python PDFMerger Too Slow

我正在使用 PyPDF2 中的 PDFMerger。 我的程序基本上是讀取文件夾中的所有 PDF 並將它們合並為一個。 我用 15 個 PDF 文件進行了測試,每個文件大小為 500kb,效果非常好。 整個過程在一秒鍾內完成。 然而,當我嘗試大量處理時,過程花費的時間比我預期的要長。 我曾嘗試合並 1000 個文件,每個文件都是 500kb,讀取和附加所有這些 PDF 總共花費了 3 秒,但是在編寫 PDF 時,它花費了 67 秒。 我已經嘗試了 2 個級別的合並(500 合並為 1,其他 500 合並為其他 1,然后合並最后的 2),但持續時間大致相同。 有什么辦法可以加快這個寫作過程嗎?

我在下面添加我的代碼。

            merger = PdfMerger()
            for pdf in dirs:
                if pdf.endswith('pdf'):
                       merger.append(pdf)

            merger.write(filename)
            merger.close()

這是一個比答案更長的評論。

我剛剛使用最新版本的 PyPDF2 嘗試了這個:

from PyPDF2 import PdfReader, PdfWriter
import time

reader =PdfReader("a-two-page-doc.pdf")
writer = PdfWriter()

for i in range(1000):
    writer.append(reader)


t0 = time.time()
with open("out-2000-pages.pdf", "wb") as fp:
    writer.write(fp)
t1 = time.time()

print(f"{t1-t0:.2f}s")

這在我的機器上花費了大約 0.67 秒。

您使用的是哪個版本的 PyPDF2? 哪個版本的 Python? 是否有關於特定 PDF 的內容? 單個PDF有多大? 您是否啟用了某些壓縮功能?

沒有更多的細節,沒有人能夠幫助你。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM