3

我用pyparsing做了一个语法,我有一个问题。语法尝试解析搜索查询(使用运算符优先级、括号等),我需要空格像 and 运算符一样工作。

例如,这很好用:

(word and word) or word

但这失败了:

(word word) or word

我希望第二个查询像第一个查询一样工作。

我的实际语法是:

WWORD = printables.replace("(", "").replace(")", "")
QUOTED = quotedString.setParseAction(removeQuotes)

OAND = CaselessLiteral("and")
OOR = CaselessLiteral("or")
ONOT = "-"

TERM = (QUOTED | WWORD)

EXPRESSION = operatorPrecedence(TERM,
    [
        (ONOT, 1, opAssoc.RIGHT),
        (OAND, 2, opAssoc.LEFT),
        (OOR, 2, opAssoc.LEFT)
    ])

STRING = OneOrMore(EXPRESSION) + StringEnd()
4

1 回答 1

6

解决问题的一种方法是将 AND 定义为可选运算符。如果您这样做,则必须格外小心,不要将“and”和“or”等真正的关键字误解为搜索词。此外,使用 Optional,您可以添加默认字符串,这样即使原始搜索查询中缺少“and”,您的解析文本也会为您插入它(以便于解析后处理)。

from pyparsing import *

QUOTED = quotedString.setParseAction(removeQuotes)  
OAND = CaselessLiteral("and") 
OOR = CaselessLiteral("or") 
ONOT = Literal("-")
WWORD = ~OAND + ~OOR + ~ONOT + Word(printables.replace("(", "").replace(")", ""))
TERM = (QUOTED | WWORD)  
EXPRESSION = operatorPrecedence(TERM,
    [
    (ONOT, 1, opAssoc.RIGHT),
    (Optional(OAND,default="and"), 2, opAssoc.LEFT),
    (OOR, 2, opAssoc.LEFT)
    ])

STRING = OneOrMore(EXPRESSION) + StringEnd()

tests = """\
word and ward or wird
word werd or wurd""".splitlines()

for t in tests:
    print STRING.parseString(t)

给出:

[[['word', 'and', 'ward'], 'or', 'wird']]
[[['word', 'and', 'werd'], 'or', 'wurd']]
于 2011-02-20T21:34:38.650 回答