[英]How do I convert scanned PDF into searchable PDF in Python (Mac)? e.g. OCRMYPDF module
[英]How to convert scanned PDF to searchable PDF in Python? [Environment:Windows]
我已經掃描了 pdf,我只想使用 python 轉換可搜索的 PDF。 我可以在 Abode 上進行轉換,但我想以編程方式進行,它應該是開源的。 誰能幫忙轉換 PDF?
注意:它不應該刪除 PDF 上的任何圖像。
我已經通過使用魔杖 package 解決了這個問題。 示例代碼:
from pdf2image import convert_from_path
from wand.image import Image as WandImage
TIFFPdf = convert_from_path(pdfFileName)
pageNumber = 0
for img in TIFFPdf:
pageNumber = pageNumber + 1
img1 = WandImage()
img1.read(filename='suresh.pdf' + '[' + str(pageNumber) + ']', resolution=300)
img1.compression = 'group4'
img1.save(filename=str(pageNumber) + '.tif')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.