繁体   English   中英

HTML特殊字符解析

[英]HTML speacial character parsing

我正在寻找一个Java类来解析所有HTML特殊字符。 我想这是一个普遍的问题,但是我现在找不到快速的解决方案。

我想要得到的是:

input: thè --> output: thè
input: »
input: &lraquo;
...

你知道对我有用的吗?

你用谷歌搜索吗? “ java HTML标记实体解析器”上的第一个链接引用html文本提取器

这似乎是您所需要的。

另外,您可能需要检查javax.swing.JLabel(和另一个swing文本组件)的渲染器。

尝试使用StringEscapeUtils实用程序类。 检查文档中的StringEscapeUtils.unescapeHtml()方法。

此处的文档:

http://commons.apache.org/lang/api-release/org/apache/commons/lang/StringEscapeUtils.html

在这里下载:

http://commons.apache.org/lang/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM