解析Java 6字符串文字中的unicode轉義問題...？

Question

為什么要在java 6（Sun 1.6.0_16）中編譯：

System.out.println("\u000B");

......但不是這個：

System.out.println("\u000A");

在這個計划上：

public class Test {
  public static void main(String argv[]) {
  System.out.println("\u000A");
  }
}

我得到了

Test.java:3: unclosed string literal
System.out.println("\u000A");

這里發生了什么？

Answer 1

問題是Unicode替換是在編譯的早期完成的。 Unicode轉義不僅在字符串和字符文字中有效（如其他轉義序列，如\\t ） - 它們在代碼中的任何位置都有效。 它們在規范3.3的不同區域而不是3.10.6節中描述 ; 只有后者是關於字符和字符串文字的轉義序列。

基本上，閱讀規范的第3部分有關詞法結構的更多細節:)

所以你的代碼實際上相當於：

public class Test {
  public static void main(String argv[]) {
  System.out.println("
");
  }
}

......這顯然不是有效的代碼。 對於回車和換行，基本上最好使用“\\ r”和“\\ n”轉義序列。

我個人認為這種處理Unicode轉義是Java中的一個缺陷，但現在我們無法做很多事情:(

Answer 2

在詞法分析之前擴展Unicode轉義。 Unicode轉義出現在字符串文字中的事實是無關緊要的。 見JLS 3.2。

資源

Answer 3

這是因為\\ u000a = \\ n並且編譯器處理java源代碼以將其轉換為標記，因此您不能在代碼中使用該unicode字符。 \\ u000d = \\ r \\ n也一樣

Answer 4

如果我沒有弄錯，為了避免預處理我們可以通過更改以下行來解決它：

System.out.println((char)10);

限制是通過成為CHAR ，它的擴展名將從0到255。

解析Java 6字符串文字中的unicode轉義問題...？

問題描述

4 個解決方案

解決方案1
18 已采納 2010-10-25 08:32:39

解決方案2
3 2010-10-25 08:34:30

解決方案3
1 2010-10-25 09:08:36

解決方案4
0 2012-12-27 10:20:02

解析Java 6字符串文字中的unicode轉義問題...？

問題描述

4 個解決方案

解決方案1 18 已采納 2010-10-25 08:32:39

解決方案2 3 2010-10-25 08:34:30

解決方案3 1 2010-10-25 09:08:36

解決方案4 0 2012-12-27 10:20:02

解決方案1
18 已采納 2010-10-25 08:32:39

解決方案2
3 2010-10-25 08:34:30

解決方案3
1 2010-10-25 09:08:36

解決方案4
0 2012-12-27 10:20:02