[英]HTML speacial character parsing
我正在寻找一个Java类来解析所有HTML特殊字符。 我想这是一个普遍的问题,但是我现在找不到快速的解决方案。
我想要得到的是:
input: thè --> output: thè
input: »
input: &lraquo;
...
你知道对我有用的吗?
你用谷歌搜索吗? “ java HTML标记实体解析器”上的第一个链接引用html文本提取器
这似乎是您所需要的。
另外,您可能需要检查javax.swing.JLabel(和另一个swing文本组件)的渲染器。
尝试使用StringEscapeUtils实用程序类。 检查文档中的StringEscapeUtils.unescapeHtml()方法。
此处的文档:
http://commons.apache.org/lang/api-release/org/apache/commons/lang/StringEscapeUtils.html
在这里下载:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.