簡體   English   中英

PDFBox convertToImage無法正確呈現某些PDF

[英]PDFBox convertToImage not rendering some PDFs correctly

我正在使用PDFBox的PDPage.convertToImage()方法將已加載的PDF文件的頁面轉換為圖像。 對於某些PDF來說,它可以正常工作,但是它給我帶來了很多文件的控制台錯誤,這些文件隨后無法在屏幕上正確顯示-圖像和文本丟失。

Dec 31, 2013 7:15:34 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: EI
Dec 31, 2013 7:15:34 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont getawtFont
INFO: Using font SansSerif.plain instead

Dec 31, 2013 7:02:15 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: i

只需使用以下命令即可完成文件加載:

PDDocument pdfDoc = PDDocument.load(file);
List<PDPage> pages = pdfDoc.getContent().getDocumentCatalog().getAllPages();
PDPage page = pages.get(pageNo);
page.convertToImage();

我嘗試使用loadNonSeq()代替load(),但這沒有幫助。 我應該對PDFStreamEngine做些什么,以使其能夠處理這些PDF? 我不確定讀者是否可以實際渲染這些內容,或者不確定該功能是否需要啟用。

您的問題在我先前回答的帖子中得到了解決,通過使用PDFRender jar可以實現。

如何提高PDF渲染器中圖像的分辨率?

發布的問題僅轉換PDF的第一頁,而答案將PDF的所有頁面轉換為圖像格式。

從這里嘗試fontbox jar http://mvnrepository.com/artifact/org.apache.pdfbox/fontbox/1.8.5

或使用Maven存儲庫。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM