簡體   English   中英

如何將 OCR 文本從一個 PDF 傳輸到另一個 PDF?

[英]How to transfer OCR text from one PDF to another PDF?

我有一個相同的掃描 PDF 的兩個版本。 其中一個具有 OCR 層。 如何將圖層轉移到另一圖層? 我已經安裝了 Ghostscript,但我不知道下一步該做什么。

如何使用鬼腳本

PDF 中沒有“OCR 層”之類的東西。

您最有可能擁有的是 PDF 文件,該文件具有掃描圖像和使用 OCR 從該圖像中提取的文本,該文本已繪制為“不可見”文本(文本渲染模式 3)。

通常,您無法在 PDF 文件之間復制和粘貼文本,因此很難按照您的要求進行操作。 我不知道有什么工具可以幫助你,我可以肯定地說,Ghostscript 絕對不會幫助你。

很可能您還需要從 PDF 文件中復制字體(或 CIDFont),如果它有一個 ToUnicode CMap,您肯定也想要它,否則搜索將不起作用(而且這種類型的意義不大OCR 否則)。

既然您有一個包含 OCR 文本的 PDF 文件,為什么不簡單地使用該 PDF 呢? 我看不出您為什么要將其“轉移”到另一個 PDF 文件的任何原因。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM