antlr 词法分析器和解析器的转义字符

Question

我是 antlr 的新手并希望构建一个解析器，其中一部分需要我匹配字符串，但是我希望保留转义字符的含义

\0, \b, \t, \n, \f, \r, \", \', \\

其中一些符号在我的语言位置的语法中以各种方式使用，因此我希望通过以下方式定义一个 ESCAPE_CHAR 标记：

SINGLE_QUOTE: '\'' ;
DOUBLE_QUOTE: '"' ;
ESCAPE_ZERO : '\0' ;
ESCAPE_BACKSPACE : '\b' ;
ESCAPE_TAB : '\t' ;
ESCAPE_NEWLINE : '\n' ;
ESCAPE_FORMFEED : '\f' ;
ESCAPE_CARRIAGERETURN : '\r' ;
ESCAPE_BACKSLASH : '\\' ;
ESCAPE_CHAR: ESCAPE_ZERO | ESCAPE_BACKSPACE | ESCAPE_TAB | ESCAPE_NEWLINE | ESCAPE_FORMFEED | ESCAPE_CARRIAGERETURN | DOUBLE_QUOTE | SINGLE_QUOTE | ESCAPE_BACKSLASH ;

但是，ESCAPE_ZERO 给了我警告

non-fragment lexer rule ESCAPE_CHAR can match the empty string

当使 ESCAPE_ZERO 成为片段时，我看到了警告

invalid escape sequence \0

我是 antlr 的新手，所以我真的不知道我需要做些什么改变，任何帮助将不胜感激

Answer 1

您还需要在 ANTLR 中转义文字中的\ 。 如果你不这样做，词法分析器规则ESCAPE_ZERO: '\0'; 匹配 null 字符而不是后跟零位的反斜杠。 而这个 null 字符没有“宽度”，这会导致 ANTLR 产生错误[...] can match the empty string 。

而不是所有单独的规则，尝试这样的事情：

STRING
 : '"' ( ~[\\"\r\n] | ESCAPE_CHAR )* '"'
 ;

fragment ESCAPE_CHAR
 : '\\' [0btnfr"'\\]
 ;

antlr 词法分析器和解析器的转义字符

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-02-01 18:18:20

antlr 词法分析器和解析器的转义字符

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-02-01 18:18:20

解决方案1
1 已采纳 2021-02-01 18:18:20