解析某些html標記后，itext pdf生成失敗

Question

我有這個html代碼，它位於db中，我想用pdf解析它。 我正在使用itext生成pdf。 這是db中的html：

<p>no note.</p><br>
<ul><br>
<li><strong>section</strong></li><br>
</ul><br>
<ol><br>
<li>first</li><br>
<li><em>second</em></li><br>
<li><span style="text-decoration: underline;">third</span></li><br>
</ol><br>

這是解析並插入pdf的內容：

<p>no note.</p><br>
<strong>section</strong><br>
first<br>
<em>second</em><br>
<span style="text-decoration: underline;">third</span><br>

這也是我將html解析為pdf的代碼：

org.jsoup.nodes.Document doc = Jsoup.parse(text);
List<Element> objects;
objects = HTMLWorker.parseToList(new StringReader(doc.outerHtml()), null);
for (Element object : objects) {
        Element ele = (Element) object;
        document.add(ele);
}

可以看到，沒有顯示數字和項目符號（在html中是“ ol”和“ li”標記）。 如何解決呢？

編輯

有關更多說明。 這是我在html中的文字：

在此處輸入圖片說明

這是插入pdf的注釋：

在此處輸入圖片說明

Answer 1

我的朋友剛剛解決了它：

XMLWorkerHelper.getInstance().parseXHtml(new XHtmlElementHandler(document), new StringReader(text));

簡單:)

Answer 2

很久以前不推薦使用HTMLWorker ，其目的不是轉換完整的HTML頁面。 它基本上不知道網頁由<head>和<body>部分組成。

XMLWorker旨在作為解析XML的通用框架。 為了避免這些沖突， iText 7開始使用convertToPdf函數，該函數能夠將HTML轉換為PDF。

以下將是代碼片段。

HtmlConverter.convertToPdf(new File(src), new File(dest));

將您的HTML編碼添加到第一個參數中，並提供文件位置，以在提供的位置（文件路徑）將HTML保存為PDF。

解析某些html標記后，itext pdf生成失敗

問題描述

2 個解決方案

解決方案1
0 已采納 2013-05-15 21:40:10

解決方案2
0 2019-03-17 14:50:11

解析某些html標記后，itext pdf生成失敗

問題描述

2 個解決方案

解決方案1 0 已采納 2013-05-15 21:40:10

解決方案2 0 2019-03-17 14:50:11

解決方案1
0 已采納 2013-05-15 21:40:10

解決方案2
0 2019-03-17 14:50:11