用于自定义需求的Antlr解析器

Question

I have a very peculiar requirement to parse inputs using ANTLR. 我对使用ANTLR解析输入有非常特殊的要求。 I would like to be able to parse expressions like; 我希望能够解析类似的表达式；

Correct Inputs 正确输入

user name 用户名
user_name user-name user_name用户名
| | EATALL any thing could come here/ok | EATALL任何事情都可能在这里/确定| EATALL ... 全部吃掉 ...

Invalid Inputs 输入无效

user/name 用户名
user&name^face 用户名

user name -> [user] [name] 用户名-> [用户] [名称]
user_name -> [user_name] 用户名-> [用户名]
|EATALL user/name my user -> [user/name my user] | EATALL用户/为我的用户命名-> [用户/为我的用户命名]

This already seems like an ambiguous case of tokenization for me. 对我来说，这似乎已经是模棱两可的情况了。 I am seeking your suggestions on dealing problems like these in antlr. 我正在就处理此类问题寻求您的建议。 Thanking you in advanced. 在此先感谢您。

Answer 1

So, what have you tried? 那么，您尝试了什么？ Is you question specific to Antlr 3 or can you use Antlr 4? 您是对Antlr 3提出疑问还是可以使用Antlr 4？

For Antlr 3, you can use semantic predicates to condition token rule selection. 对于Antlr 3，您可以使用语义谓词来限制令牌规则的选择。 Since Antlr 4 does not have symbolic semantic predicates, you can use native code actions to achieve essentially the same result. 由于Antlr 4没有符号语义谓词，因此您可以使用本机代码操作来实现基本相同的结果。 For example (untested): 例如（未测试）：

lexer grammar eatall ;

ValidSimple : { isCurrenLineJustTEXTandWS() }? TEXT ;
-- or --
ValidSimple : TEXT ( WS TEXT)* EOL?  { emitEachTEXTasNewValidSimpleToken(); } ;

ValidEatAll : IgnoreL .*? IgnoreR    { trimIgnoreLRTextfromTokenText(); } ;
Invalid     : WS+ | .*? EOL?         -> channel(HIDDEN) ;

IgnoreL : .*? MARK ;
IgnoreR : MARK .*? EOL? ;

fragment MARK : '| EATALL' ;
fragment TEXT : [a-zA-Z0-9_-] ;
fragment EOL  : '\r'? '\n' ;
fragment WS   : [ \t] ;

用于自定义需求的Antlr解析器

问题描述

1 个解决方案

解决方案1
0 已采纳 2013-04-03 20:00:24

用于自定义需求的Antlr解析器

问题描述

1 个解决方案

解决方案1 0 已采纳 2013-04-03 20:00:24

解决方案1
0 已采纳 2013-04-03 20:00:24