[英]I am trying to create a program that converts bytes to human readable JAVA
[英]How can I create a basic human readable plain text representation of XHTML using Java?
鑒於一些簡單的XHTML,我想創建一個人類可讀的純文本版本。 這將涉及刪除所有HTML標記,但添加或保留一些空格。
例如,這個輸入:
<div>
<p>This is some text, some is <b>bold</b>.</p>
<ul>
<li>Point one</li>
<li>Point two</li>
</ul>
</div>
會成為:
"This is some text, some is bold. Point one Point two"
(LI之間的逗號是理想的...... :)
傑里科HTML解析器。 您可以刪除所有標記或調用試圖模仿外觀的“渲染器”類(例如,您的項目符號列表將被標記)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.