簡體   English   中英

Java從無效的HTML創建PDF或圖像

[英]Java create PDF or Image from an invalid HTML

我想使用Java從'無效' HTML文件創建PDF (或任何圖像格式[ png,jpg,bmp ..])。 我用Google搜索並找到了一個工具: iText ,以及一些使用iText從Java用HTML創建PDF的教程。

在本教程(X)HTML到PDF中使用Java ,它適用於有效的HTML,我有一個像這樣的PDF文件。 但如果我試圖從我的HTML創建PDF我有一些錯誤。

首先,我的HTML格式不正確,遺憾的是無法改變。 我把它上傳到這里 ,W3C的驗證器發現了28個錯誤

我的選擇是:

  • 首先清理並驗證我的HTML並盡快創建PDF。
  • 找到另一個工具(適用於我的問題)。
  • 你的建議(使用Java)。
  • 最后選擇; 使用另一個平台( .net,Php,Python等)並使用我的應用程序中的Webservices。

請幫我解決這個問題。 先感謝您

您可以使用像http://jtidy.sourceforge.net/這樣的工具為您修復HTML並針對jTidy的輸出運行iText ...

您可以使用支持破壞HTML的HTML解析器,例如jsoup

像jtidy一樣,它可以自動創建有效的HTML,但它也允許您操作HTML DOM,因此您可以嘗試以您希望的方式明確地解決最大的問題。

試試wkhtmltopdf 這使用Headless瀏覽器(webkit)首先渲染html,然后生成PDF。 我在我的一個java項目中使用它並且運行良好。

它提供了一些靈活的命令行選項, 以下是選項列表及其用法的鏈接。 它適用於那些形狀不好的htmls。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM