[英]Escape characters for an antlr lexer and parser
我是 antlr 的新手并希望构建一个解析器,其中一部分需要我匹配字符串,但是我希望保留转义字符的含义
\0, \b, \t, \n, \f, \r, \", \', \\
其中一些符号在我的语言位置的语法中以各种方式使用,因此我希望通过以下方式定义一个 ESCAPE_CHAR 标记:
SINGLE_QUOTE: '\'' ;
DOUBLE_QUOTE: '"' ;
ESCAPE_ZERO : '\0' ;
ESCAPE_BACKSPACE : '\b' ;
ESCAPE_TAB : '\t' ;
ESCAPE_NEWLINE : '\n' ;
ESCAPE_FORMFEED : '\f' ;
ESCAPE_CARRIAGERETURN : '\r' ;
ESCAPE_BACKSLASH : '\\' ;
ESCAPE_CHAR: ESCAPE_ZERO | ESCAPE_BACKSPACE | ESCAPE_TAB | ESCAPE_NEWLINE | ESCAPE_FORMFEED | ESCAPE_CARRIAGERETURN | DOUBLE_QUOTE | SINGLE_QUOTE | ESCAPE_BACKSLASH ;
但是,ESCAPE_ZERO 给了我警告
non-fragment lexer rule ESCAPE_CHAR can match the empty string
当使 ESCAPE_ZERO 成为片段时,我看到了警告
invalid escape sequence \0
我是 antlr 的新手,所以我真的不知道我需要做些什么改变,任何帮助将不胜感激
您还需要在 ANTLR 中转义文字中的\
。 如果你不这样做,词法分析器规则ESCAPE_ZERO: '\0';
匹配 null 字符而不是后跟零位的反斜杠。 而这个 null 字符没有“宽度”,这会导致 ANTLR 产生错误[...] can match the empty string 。
而不是所有单独的规则,尝试这样的事情:
STRING
: '"' ( ~[\\"\r\n] | ESCAPE_CHAR )* '"'
;
fragment ESCAPE_CHAR
: '\\' [0btnfr"'\\]
;
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.