如何將掃描的 PDF 轉換為 Python 中的可搜索 PDF？ [環境：Windows]

Question

我已經掃描了 pdf，我只想使用 python 轉換可搜索的 PDF。 我可以在 Abode 上進行轉換，但我想以編程方式進行，它應該是開源的。 誰能幫忙轉換 PDF？

注意：它不應該刪除 PDF 上的任何圖像。

Answer 1

我已經通過使用魔杖 package 解決了這個問題。 示例代碼：

from pdf2image import convert_from_path

from wand.image import Image as WandImage

TIFFPdf = convert_from_path(pdfFileName)
pageNumber = 0
for img in TIFFPdf:
        pageNumber = pageNumber + 1
   
        img1 = WandImage()
        img1.read(filename='suresh.pdf' + '[' + str(pageNumber) + ']', resolution=300)
        img1.compression = 'group4'
        img1.save(filename=str(pageNumber) + '.tif')

如何將掃描的 PDF 轉換為 Python 中的可搜索 PDF？ [環境：Windows]

問題描述

1 個解決方案

解決方案1
0 2021-01-29 10:02:30

如何將掃描的 PDF 轉換為 Python 中的可搜索 PDF？ [環境：Windows]

問題描述

1 個解決方案

解決方案1 0 2021-01-29 10:02:30

解決方案1
0 2021-01-29 10:02:30