簡體   English   中英

Escaping 雙斜杠與正則表達式在 Java

[英]Escaping double-slashes with regular expressions in Java

我有這個單元測試:

public void testDeEscapeResponse() {
    final String[] inputs = new String[] {"peque\\\\u0f1o", "peque\\u0f1o"};
    final String[] expected = new String[] {"peque\\u0f1o", "peque\\u0f1o"};
    for (int i = 0; i < inputs.length; i++) {
        final String input = inputs[i];
        final String actual = QTIResultParser.deEscapeResponse(input);
        Assert.assertEquals(
            "deEscapeResponse did not work correctly", expected[i], actual);
    }
}

我有這個方法:

static String deEscapeResponse(String str) {
    return str.replaceAll("\\\\", "\\");
}

單元測試因以下錯誤而失敗:

java.lang.StringIndexOutOfBoundsException: String index out of range: 1
    at java.lang.String.charAt(String.java:686)
    at java.util.regex.Matcher.appendReplacement(Matcher.java:703)
    at java.util.regex.Matcher.replaceAll(Matcher.java:813)
    at java.lang.String.replaceAll(String.java:2189)
    at com.acme.MyClass.deEscapeResponse
    at com.acme.MyClassTest.testDeEscapeResponse

為什么?

使用String.replace進行文字替換,而不是使用正則表達式的String.replaceAll

例子:

"peque\\\\u0f1o".replace("\\\\", "\\")    //  gives  peque\u0f1o

String.replaceAll采用正則表達式,因此\\\\被解釋為表達式\\ ,后者又匹配單個\ (替換字符串也對\進行了特殊處理,因此那里也有錯誤。)

要使String.replaceAll像您期望的那樣工作,您需要這樣做

"peque\\\\u0f1o".replaceAll("\\\\\\\\", "\\\\")

我認為問題在於您使用的是replaceAll()而不是replace()。 replaceAll 在第一個字段中需要一個正則表達式,而您只是嘗試進行字符串匹配。

有關Matcher的信息,請參見 javadoc:

請注意,替換字符串中的反斜杠 (\) 和美元符號 ($) 可能會導致結果與將其視為文字替換字符串時的結果不同。 如上所述,美元符號可以被視為對捕獲的子序列的引用,並且反斜杠用於轉義替換字符串中的文字字符。

因此,使用replaceAll您不能用反斜杠替換任何內容。 因此,對於您的情況,一個非常瘋狂的解決方法是str.replaceAll("\\\\(\\\\)", "$1")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM