[英]Java create PDF or Image from an invalid HTML
我想使用Java從'無效' HTML文件創建PDF (或任何圖像格式[ png,jpg,bmp ..])。 我用Google搜索並找到了一個工具: iText ,以及一些使用iText從Java用HTML創建PDF的教程。
在本教程(X)HTML到PDF中使用Java ,它適用於有效的HTML,我有一個像這樣的PDF文件。 但如果我試圖從我的HTML創建PDF我有一些錯誤。
首先,我的HTML格式不正確,遺憾的是無法改變。 我把它上傳到這里 ,W3C的驗證器發現了28個錯誤 。
我的選擇是:
請幫我解決這個問題。 先感謝您
您可以使用像http://jtidy.sourceforge.net/這樣的工具為您修復HTML並針對jTidy的輸出運行iText ...
您可以使用支持破壞HTML的HTML解析器,例如jsoup 。
像jtidy一樣,它可以自動創建有效的HTML,但它也允許您操作HTML DOM,因此您可以嘗試以您希望的方式明確地解決最大的問題。
試試wkhtmltopdf
。 這使用Headless瀏覽器(webkit)首先渲染html,然后生成PDF。 我在我的一個java項目中使用它並且運行良好。
它提供了一些靈活的命令行選項, 以下是選項列表及其用法的鏈接。 它適用於那些形狀不好的htmls。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.