簡體   English   中英

HTML特殊字符解析

[英]HTML speacial character parsing

我正在尋找一個Java類來解析所有HTML特殊字符。 我想這是一個普遍的問題,但是我現在找不到快速的解決方案。

我想要得到的是:

input: thè --> output: thè
input: »
input: &lraquo;
...

你知道對我有用的嗎?

你用谷歌搜索嗎? “ java HTML標記實體解析器”上的第一個鏈接引用html文本提取器

這似乎是您所需要的。

另外,您可能需要檢查javax.swing.JLabel(和另一個swing文本組件)的渲染器。

嘗試使用StringEscapeUtils實用程序類。 檢查文檔中的StringEscapeUtils.unescapeHtml()方法。

此處的文檔:

http://commons.apache.org/lang/api-release/org/apache/commons/lang/StringEscapeUtils.html

在這里下載:

http://commons.apache.org/lang/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM