[英]Java to create XML and using XSL to create HTML escaped characters
我有一个问题
现在,我遇到了\\r
和\\n
以及其他一些时髦符号的问题。 我应该用xml转义还是html转义来解析xml的内容。 默认的Java转义实用程序类对此做得很差,而我在网上发现的自定义类也不起作用。
一个好的解决方案是将\\n
和\\r
替换为<p> </p>
还是什么html tag
是一个好的选择? 谢谢!
一个简单的示例是我在xml中的日期值,该日期值以字符串形式传递,并且使用了所有转义符。
原文:(同一时间,我不记得是哪个)- Mon, 29 Feb 2016 13:40:58 EST (-0500)
转义的XML条目: - <Date>Mon&#044; 29 Feb 2016 03&#058;40&#058;43 EST&#040;&#045;0500&#041;</Date>
<Date>Mon&#044; 29 Feb 2016 03&#058;40&#058;43 EST&#040;&#045;0500&#041;</Date>
解析的HTML输出: Mon, 29 Feb 2016 03:40:43 EST(-0500)
Mon, 29 Feb 2016 03:40:43 EST(-0500)
特殊字符的编码和解码显然出了问题。 但是当将其解析为html时
编辑:我也有这个垃圾,我什至不知道是: 
编辑:我解决了日期问题,但它仍然不能正确编码部分。
public static String entityEncode(String text) {
String result = text;
if (result == null)
return result;
return StringEscapeUtils.escapeXml(XMLStringUtil.escapeControlChrs(result));
}
另一类是:
public class XMLStringUtil {
private static HashSet<Character> illegalChrSet = new HashSet<>();
static {
final String illegalChrs = "\u0000\u0001\u0002\u0003\u0004\u0005" +
"\u0006\u0007\u0008\u000B\u000C\u000E\u000F\u0010\u0011\u0012" +
"\u0013\u0014\u0015\u0016\u0017\u0018\u0019\u001A\u001B\u001C" +
"\u001D\u001E\u001F\uFFFE\uFFFF";
for (int i=0; i < illegalChrs.length(); i++) {
illegalChrSet.add(illegalChrs.charAt(i));
}
}
public static String escapeControlChrs(String str) {
if (str == null) {
return null;
}
StringBuilder sb = new StringBuilder(str.length());
for (int i=0; i < str.length(); i++) {
char chr = str.charAt(i);
if (illegalChrSet.contains(chr)) {
sb.append("\\x");
sb.append(String.format("%04x", (int) chr));
} else {
sb.append(chr);
}
}
return sb.toString();
}
public static String removeControlChrs(String str) {
if (str == null) {
return null;
}
StringBuilder sb = new StringBuilder(str.length());
for (int i=0; i < str.length(); i++) {
char chr = str.charAt(i);
if (! illegalChrSet.contains(chr)) {
sb.append(chr);
}
}
return sb.toString();
}
但是我仍然在xml中得到这个垃圾:
<Info>The origin domain used for comparison was: 
google.ca.ca
blah blah blah
</Info>
它发生在新行上。
问题是当您编码为xml本身时。 HTML正在正确解析值。 对于html&是&。 请检查您如何编码为xml。 XML不应具有所有这些ascii字符。
基本上,您的字符串具有字符“ /”。 编码后,它已转换为xml。 html未知。 创建xml时,用/替换'/',并且解码的html会自动转换为'/'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.