簡體   English   中英

如何使用Java創建XHTML的基本人類可讀純文本表示?

[英]How can I create a basic human readable plain text representation of XHTML using Java?

鑒於一些簡單的XHTML,我想創建一個人類可讀的純文本版本。 這將涉及刪除所有HTML標記,但添加或保留一些空格。

例如,這個輸入:

<div>
<p>This is some text, some is <b>bold</b>.</p>
<ul>
  <li>Point one</li>
  <li>Point two</li>
</ul>
</div>

會成為:

"This is some text, some is bold. Point one Point two"

(LI之間的逗號是理想的...... :)

傑里科HTML解析器。 您可以刪除所有標記或調用試圖模仿外觀的“渲染器”類(例如,您的項目符號列表將被標記)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM