繁体   English   中英

escaping Java 字符串到 utf-8

[英]escaping Java string to utf-8

我正在寻找用于将常规字符串转换为 utf-8 字符串的 java 工具。

例如

input: special-数据应用-text

output: special-%u6570%u636E%u5E94%u7528-text

(注意前面的“%u”)

两件事情:

  1. 您要作为结果的字符串不是UTF-8,至少您作为示例输入的字符串是UTF-16编码的(Java在内部使用UTF-16)

  2. 为您提供所需字符串的代码示例:

     String str = "special-数据应用-text"; StringBuilder builder = new StringBuilder(); for(char ch: str.toCharArray()) { if(ch >= 0x20 && ch <= 0x7E) { builder.append(ch); } else { builder.append(String.format("%%u%04X", (int)ch)); } } String result = builder.toString(); 

让我向您推荐Unbescape [ http://www.unbescape.org ]

在其他转义操作(HTML,XML等)中,它将允许您使用以下方法转义Java文字:

final String escaped = JavaEscape.escapeJava(text);

根据StackOverflow规则免责声明:我是Unbescape的作者。

你可以尝试以下

StringBuilder b = new StringBuilder();

for( char c : s.toCharArray() ){
    if( ( 1024 <= c && c <= 1279 ) || ( 1280 <= c && c <= 1327) || ( 11744 <= c && c <= 11775) || ( 42560 <= c && c <= 42655)  ){
        b.append( "\\u" ).append( Integer.toHexString(c) );
    }else{
        b.append( c );
    }
}

return b.toString();

这里找到

尝试这个

String s= URLEncoder.encode(str, "UTF-8").replaceAll("%(..)%(..)", "%u$1$2");

对于那些不需要 java 工具,但需要在线工具的人,这里是工具https://itpro.cz/juniconv/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM