繁体   English   中英

递归布尔和/或数组jison解析器

[英]recursive boolean and/or to array jison parser

我是jison的新手,并且设法拼凑了一个有用的查询解析器。 我现在正在尝试创建一个解析器,它可以解析像“a == 1和b == 1和c == 1”之类的字符串到类似的对象中

{and: [
  {a: {eq: 1}},
  {b: {eq: 1}},
  {c: {eq: 2}}
]}

而像“a == 1或b == 1和c == 1”之类的字符串应该解析为像这样的对象

{or: [
  {a: {eq: 1}},
  {and: [
    {b: {eq: 1}},
    {c: {eq: 1}}
  ]}
]}

到目前为止,我的语法看起来像这样:

%lex

%%
\s+       /*skip whitespace*/
\"(\\.|[^"])*\"          yytext = yytext.substr(1, yyleng-2); return 'STRING';
"=="                     return '==';
and[^\w]                 return 'and';
or[^\w]                  return 'or';
[0-9]+(?:\.[0-9]+)?\b    return 'NUMBER';
[a-zA-Z][\.a-zA-Z0-9_]*  return 'SYMBOL';
<<EOF>>                  return 'EOF';

/lex

%left 'or'
%left 'and'
%left '=='

%start expressions

%%

expressions
  : e EOF
    {$$ = $1;}
  ;

e
  : property '==' value
    { $$ = {}; $[$1] = {eq: $3}; }
  | boolAnd 
    { $$ = {and: $1}}
  | boolOr 
    { $$ = {or: $1}}
  ;

boolAnd
  : boolAnd 'and' e
    {$$ = $1; $1.push($3);}
  | e 'and' e
    {$$ = [$1, $3];}
  ;

boolOr
  : boolOr 'or' e
    {$$ = $1; $1.push($3);}
  | e 'or' e
    {$$ = [$1, $3];}
  ;

property
  : SYMBOL
    {$$ = $1;}
  ;

value
  : NUMBER
    {$$ = Number(yytext);}
  | STRING
    {$$ = yytext; }
  ;

它给了我以下冲突错误:

Conflict in grammar: multiple actions possible when lookahead token is and in state 4
- reduce by rule: e -> boolAnd
- shift token (then go to state 11)
Conflict in grammar: multiple actions possible when lookahead token is or in state 5
- reduce by rule: e -> boolOr
- shift token (then go to state 12)

States with conflicts:
State 4
  e -> boolAnd . #lookaheads= EOF and or
  boolAnd -> boolAnd .and e #lookaheads= EOF and or
State 5
  e -> boolOr . #lookaheads= EOF and or
  boolOr -> boolOr .or e #lookaheads= EOF or and

有人能够提出我做错的建议吗? 非常感谢

以来

e : boolAnd

无法决定:

boolAnd: e 'and' e
       | boolAnd 'and' e

这就是jison抱怨的。 (并且值得注意的是, boolAnde的减少似乎不是你想要的。它实际上是一个类型错误,或者如果JS有类型的话。)

就个人而言,我只是使用二叉树; 根据我的经验,他们结果更容易合作。 您可以使用单个非终端和优先级声明轻松完成此操作。

%left 'or'
%left 'and'
%%
e
  : property '==' value
    { $$ = {eq: [$1, $3]}; /* This seems better to me. YMMV. }
  | e 'and' e
    { $$ = {and: [$1, $3]}}
  | e 'or' e
    { $$ = {or: [$1, $3]}}
  | '(' e ')'
    { $$ = $2  /* You didn't have this one, but it seems useful */ }
  ;

有可能创建一个语法来处理可变运算符(即将x OP y OP z减少到{OP: [x, y, z]} ),但实际上要做到这一点真是相当多的工作,而且确实如此。基于优先级声明,不容易屈服于解决方案。 除非你真的想要区分x OP y OP zx OP (y OP z) ,这在布尔运算符的情况下是不必要的,在第二遍中折叠多个相似的二元运算符通常更容易和更通用。解析树,或直接在创建二进制节点时,通过检查子表达式的运算符类型。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM