簡體   English   中英

讓 ghostscript 單獨留下 JBIG2 文件

[英]Having ghostscript leave JBIG2 files alone

我正在使用gs從 PDF 中刪除一些不好的 OCR,這些 PDF 本質上是帶有不可見文本層的書頁圖像。 其中一些頁面圖像被編碼為 JBIG2。 當我通過 gs 運行它們時,它會將圖像格式更改為 CCIT,這通常還不錯,但可能比 JBIG2 版本大 10 到 20 倍。

我一直在尋找一種方法讓 gs 不理會它們——比如 PassThroughJPEGImages——或者用 MonoImageEncoder 重新編碼它們,但我沒有成功。 我沒有找到任何類似的直通選項,並且在將編碼器設置為 JBIG2Encode 時出錯。 我假設從我確實發現后者不是標准選項,但需要 Luratech 庫。

任何人都可以確認或 - 最好 - 解釋我的錯誤嗎?

TIA。

目前沒有辦法讓 Ghostscript 通過 JBIG2 圖像保持不變。

pdfwrite 設備不允許 JBIG2Encode 作為可能的編碼方法,因此您不能使用它。

這樣做的結果是您只能使用 CCITTFaxEncode 作為 MonoImageEncode 參數。

一般來說,JBIG2 比 CCITTFax 好不了多少,但文本除外,如果文本內容已知,則可以通過重用段來實現顯着節省(這也是 JBIG2 解碼錯誤的來源) 2013)。 聽起來你的圖像是這樣編碼的,所以是的,你會得到更大的圖像。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM