簡體   English   中英

PDF小丑圖像提取圖像倒置

[英]PDFClown image extraction images inverted

我正在使用PDFClown,正在嘗試從pdf文件提取圖像。 我使用源代碼提供的示例代碼,該代碼可在http://pdfclown.org上找到。

ImageExtractionSample.java。

問題在於圖像是負片並且水平翻轉。 有誰知道如何解決這個問題?

檢查其他PDF文件,查看其他PDF文件是否也提供旋轉或翻轉的圖像。 ImageExtractionSample.java不會檢查圖像對象的旋轉或矩陣定義的轉換,而只是將內容原樣寫入文件中(因此它將適用於JPG圖像,但不適用於CCIT編碼的圖像)。

因此,當您從PDF提取圖像時,需要考慮以下事項:

  • 可以使用附加的變換矩陣(CTM)旋轉圖像;
  • 圖像可以作為變換形式的一部分進行旋轉/變換;
  • 圖像可以不經過任何變形而放置在頁面上,但是頁面本身可以旋轉;
  • 圖像可能在其頂部包含覆蓋的蒙版(並且可以旋轉和變形蒙版);
  • JPG圖像幾乎可以存儲,但是PDF還支持其他格式,例如CCIT壓縮,LZW壓縮圖像等。

但是一般的建議是,當您使用PDFClown從PDF提取JPG圖像時,應該像SourceForge項目討論頁面上建議的那樣翻轉和旋轉提取的圖像。

如果您可以指向特定的PDF示例文件,則建議解決方案會更容易。

如果您使用的是Windows,則可以使用此免費的PDF Multitool實用程序,使用“圖像提取”對話框中的“提取原始圖像(不進行轉換)”選項比較PDF中未轉換和轉換的圖像。

免責聲明:我為ByteScout工作,PDF Multitool實用程序對於商業和非商業目的都是免費的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM