2

我想用 antlr3 创建一个简单的标准表达式解析器

更新:单独的 AND OR 表达式规则以支持 AND/OR 不同的层次结构,但还有另一个问题: 如果表达式类似于:a = 1 and b = 2 and c = 3 根据当前实现,树应如下所示:

       =      =
 (a = 1)(b = 2)(c = 3)
But I want to generate it as follows:
          =       =
    (a = 1)(b = 2)
               (c = 3)
First "and" should be higher priority than another, because I want to parse all the expression as left exp and right exp.

我想我需要在“subcond”中重新编写规则以使a = 1 and b = 2 and c = 3 -> (a = 1 and b = 2) and c = 3

但尝试了很多次都没有运气。有没有人知道如何实现它?谢谢。


我的目标是解析某种 SQL where 子句样式的句子,并构建一个 AST 来遍历。

例如:

    a = 1 and (b = 2 or c = 3)            //This one can parse correctly.
    a = 1 and ((b = 2 or c = 3) or d = 4) //This one cannot parse correctly, missing last d = 4 in the tree. 
                                          //Tree is not correct.

我当前的语法文件无法解析上述复杂条件。因为我是 antlr 的新手,不知道如何修改我的语法以更正确地实现上述方法。有人可以帮忙吗?!任何建议或意见表示赞赏。

我的语法如下(根据评论更新。警告问题已解决。):

grammar CriteriaExpression;

options {
  output       = AST;
  ASTLabelType = CommonTree;
  language     = Java;
}

tokens {
  AND    = 'and';
  OR     = 'or';
  LPAREN = '(';
  RPAREN = ')';
}

@lexer::header {
package com.antlr;
}

@parser::header {
package com.antlr;
}

eval
:
expression
;

表达式:andExp (OR^ andExp)* ;

andExp : subcond (AND^ subcond)* ;

subcond : LPAREN 表达式 RPAREN |atom ;

atom
  :
  EXPR OPERATOR EXPR
  ;

OPERATOR
  :
  '='| '<>'| '!='| '<='| '!>'| '<'| '>='| '!<'| '>'| 'like'
  ;

EXPR
  :
  ('a'..'z'| 'A'..'Z'| '0'..'9')+
  ;

 WILDCARD
  :
  '%'
  ;

WS
  :
  ('\t'| ' '| '\r'| '\n'| '\u000C')*
   {$channel = HIDDEN;}
  ;

((a=1)) ((a=1))

a = 1 和 ((b = 2 或 c = 3) 或 d = 4) a = 1 和 ((b = 2 或 c = 3) 或 d = 4)

4

2 回答 2

2

可能是我错了,但我认为你与这个东西有关的问题LPAREN* something RPAREN* 你可以写这样的东西((东西)和antlr认为这个写是因为 LParent 和 Rparent 没有相互连接所以可能会使用这样的东西

COMPLEX:
    LPARENT (COMPLEX|subcond) RPARENT;

但我会再说一遍,也许我错了

更新

改变这个:

subcond
  : 
  //atom (( AND | OR )^ atom)*
  LPAREN* atom RPAREN*
  ;

对此:

subcond
  : 
  LPAREN (subcond|atom) RPAREN
  ;

使用它你现在可以写这样的东西((a=1))

于 2013-02-20T08:24:00.277 回答
2

你语法中的一个缺陷是规则

expression
  :
  LPAREN* subcond RPAREN* (( AND | OR )^ LPAREN* subcond RPAREN*)
  ;

由于您可以拥有任意数量的 LPAREN 或 RPAREN,因此无法保证它们是匹配的。我建议使用类似的东西

expression
  : subcond (( AND | OR ) subcond)?
  | subcond
  ;

并且对于subcond

subcond
  : atom (( AND | OR )^ atom)*
  | LPAREN expression RPAREN
  ;

理想情况下,您还应该有单独的规则ANDOR表达式,以便在解析树中具有正确的优先级。

更新:在您更新的语法中,您再次使用LPAREN*并且RPAREN*不会为您提供适当平衡的树。您需要像((a = 1))递归一样对多个括号进行建模,就像我在上面的示例中描述的那样。这会给一棵树

((a = 1))
  ^---^--- ATOM
 ^-----^-- Subcond -> Expression
^-------^- Subcond -> Expression

所以树会是这样的:

Expression "((a = 1))"
^
Subcond "(a = 1)"
^
Expression "(a = 1)"
^
Subcond "a = 1"
^
ATOM "a = 1"
于 2013-02-20T08:29:46.213 回答