我正在尝试解析如下所示的复杂逻辑表达式;
x > 7 AND x < 8 OR x = 4
并将解析后的字符串作为二叉树获取。对于上述表达式,预期的解析表达式应如下所示
[['x', '>', 7], 'AND', [['x', '<', 8], 'OR', ['x', '=', 4]]]
“OR”逻辑运算符的优先级高于“AND”运算符。括号可以覆盖默认优先级。更一般地说,解析后的表达式应该是这样的;
<left_expr> <logical_operator> <right_expr>
另一个例子是
input_string = x > 7 AND x < 8 AND x = 4
parsed_expr = [[['x', '>', 7], 'AND', ['x', ',', 8]], 'AND', ['x', '=', 4]]
到目前为止,我想出了这个简单的解决方案,遗憾的是它无法以二叉树的方式生成解析表达式。operatorPrecedence 在这里似乎没有帮助我,因为与前面的示例中连续存在相同的逻辑运算符。
import pyparsing as pp
complex_expr = pp.Forward()
operator = pp.Regex(">=|<=|!=|>|<|=").setName("operator")
logical = (pp.Keyword("AND") | pp.Keyword("OR")).setName("logical")
vars = pp.Word(pp.alphas, pp.alphanums + "_") | pp.Regex(r"[+-]?\d+(:?\.\d*)?(:?[eE][+-]?\d+)?")
condition = (vars + operator + vars)
clause = pp.Group(condition ^ (pp.Suppress("(") + complex_expr + pp.Suppress(")") ))
expr = pp.operatorPrecedence(clause,[
("OR", 2, pp.opAssoc.LEFT, ),
("AND", 2, pp.opAssoc.LEFT, ),])
complex_expr << expr
print complex_expr.parseString("x > 7 AND x < 8 AND x = 4")
非常感谢任何建议或指导。
BNF
对于表达式(不带括号)可以是
<expr> -> <expr> | <expr> <logical> <expr>
<expr> -> <opnd> <relational> <opnd>
<opnd> -> <variable> | <numeric>
<relational> -> <'>'> | <'='> | <'>='> | <'<='> | <'!='>