簡體   English   中英

如何將掃描的 PDF 轉換為 Python 中的可搜索 PDF? [環境:Windows]

[英]How to convert scanned PDF to searchable PDF in Python? [Environment:Windows]

我已經掃描了 pdf,我只想使用 python 轉換可搜索的 PDF。 我可以在 Abode 上進行轉換,但我想以編程方式進行,它應該是開源的。 誰能幫忙轉換 PDF?

注意:它不應該刪除 PDF 上的任何圖像。

我已經通過使用魔杖 package 解決了這個問題。 示例代碼:

from pdf2image import convert_from_path

from wand.image import Image as WandImage

TIFFPdf = convert_from_path(pdfFileName)
pageNumber = 0
for img in TIFFPdf:
        pageNumber = pageNumber + 1
   
        img1 = WandImage()
        img1.read(filename='suresh.pdf' + '[' + str(pageNumber) + ']', resolution=300)
        img1.compression = 'group4'
        img1.save(filename=str(pageNumber) + '.tif')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM