[英]HTML speacial character parsing
我正在尋找一個Java類來解析所有HTML特殊字符。 我想這是一個普遍的問題,但是我現在找不到快速的解決方案。
我想要得到的是:
input: thè --> output: thè
input: »
input: &lraquo;
...
你知道對我有用的嗎?
你用谷歌搜索嗎? “ java HTML標記實體解析器”上的第一個鏈接引用html文本提取器
這似乎是您所需要的。
另外,您可能需要檢查javax.swing.JLabel(和另一個swing文本組件)的渲染器。
嘗試使用StringEscapeUtils實用程序類。 檢查文檔中的StringEscapeUtils.unescapeHtml()方法。
此處的文檔:
http://commons.apache.org/lang/api-release/org/apache/commons/lang/StringEscapeUtils.html
在這里下載:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.