[英]How to transfer OCR text from one PDF to another PDF?
PDF 中沒有“OCR 層”之類的東西。
您最有可能擁有的是 PDF 文件,該文件具有掃描圖像和使用 OCR 從該圖像中提取的文本,該文本已繪制為“不可見”文本(文本渲染模式 3)。
通常,您無法在 PDF 文件之間復制和粘貼文本,因此很難按照您的要求進行操作。 我不知道有什么工具可以幫助你,我可以肯定地說,Ghostscript 絕對不會幫助你。
很可能您還需要從 PDF 文件中復制字體(或 CIDFont),如果它有一個 ToUnicode CMap,您肯定也想要它,否則搜索將不起作用(而且這種類型的意義不大OCR 否則)。
既然您有一個包含 OCR 文本的 PDF 文件,為什么不簡單地使用該 PDF 呢? 我看不出您為什么要將其“轉移”到另一個 PDF 文件的任何原因。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.