[英]Replacing \\u by \u in java string
我有一個包含普通文本和Unicode之間的字符串,例如“ abc \\ ue415abc”。 我想用
\\u\u003c/code>替換所有出現的
\\\\u\u003c/code>
\\u\u003c/code> 。
我該如何實現? 我使用了以下代碼,但無法正常工作。
String s = "aaa\\u2022bbb\\u2014ccc";
StringBuffer buf = new StringBuffer();
Matcher m = Pattern.compile("\\\\u([0-9A-Fa-f]{4})").matcher(s);
while (m.find()) {
try {
int cp = Integer.parseInt(m.group(1), 16);
m.appendReplacement(buf, "");
buf.appendCodePoint(cp);
} catch (NumberFormatException e) {
}
}
m.appendTail(buf);
s = buf.toString();
請幫忙。 提前致謝。
從API參考: http : //developer.android.com/reference/java/lang/String.html#replace (java.lang.CharSequence,java.lang.CharSequence)
您可以使用公開
public String replace (CharSequence target, CharSequence replacement)
string = string.replace("\\u", "\u");
or
String replacedString = string.replace("\\u", "\u");
嘗試這個:
s = s.replace(s.indexOf("\\u"), "\u");
String中contains
一個contains
方法和一個replace
方法。 話雖如此
String hello = "hgjgu\udfgyud\\ushddsjn\hsdfds\\ubjn";
if(hello.contains("\\u"))
hello.replace("\\u","\u");
System.out.println(hello);
它將打印: -hgjgu \\ udfgyud \\ ushddsjn \\ hsdfds \\ ubjn
實際上,您的初始字符串沒有任何雙反斜杠。
String s = "aaa\\u2022bbb\\u2014ccc";
產生一個包含aaa\•bbb\—ccc
的字符串,因為\\\\
只是Java字符串字面量對\\
轉義。
如果您想要Unicode字符:(StackOverflow21028089.java)
import java.util.regex.*;
class StackOverflow21028089 {
public static void main(String[] args) {
String s = "aaa\\u2022bbb\\u2014ccc";
StringBuffer buf = new StringBuffer();
Matcher m = Pattern.compile("\\\\u([0-9A-Fa-f]{4})").matcher(s);
while (m.find()) {
try {
// see example:
// http://docs.oracle.com/javase/7/docs/api/java/util/regex/Matcher.html#appendReplacement%28java.lang.StringBuffer,%20java.lang.String%29
int cp = Integer.parseInt(m.group(1), 16);
char[] chars = Character.toChars(cp);
String rep = new String(chars);
System.err.printf("Found %d which means '%s'\n", cp, rep);
m.appendReplacement(buf, rep);
} catch (NumberFormatException e) {
System.err.println("Confused: " + e);
}
}
m.appendTail(buf);
s = buf.toString();
System.out.println(s);
}
}
=>
Found 8226 which means '•'
Found 8212 which means '—'
aaa•bbb—ccc
如果您想要aaa\•bbb\—ccc
,那就是您的開始。 如果您要以aaa\\\•bbb\\\—ccc
字符串文字aaa\\\•bbb\\\—ccc
,那就是:
String s = "aaa\\\\u2022bbb\\\\u2014ccc";
並將其轉換為一個單斜杠就可以像@Overv的代碼一樣簡單:
s = s.replaceAll("\\\\u", "\\u");
盡管由於反斜杠在正則表達式模式和替換中具有特殊含義(請參閱Matcher的docs )(除了Java解析),它可能應該是:
s = s.replaceAll("\\\\\\\\u", "\\\\u");
=>
aaa\u2022bbb\u2014ccc
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.