python - 了解什么是云雀语法中的歧义

Question

from lark.lark import Lark

text = """
start_thing {
  loc int {
    from 0,
    to 1093,
    strand plus,
    id gi 384632836
  }
}
"""

grammar = """\
thing: "start_thing" node
locus_info: "loc int" "{" int_info "," int_info "," STRAND_INFO "," int_info "}"
int_info: TAGS? INT
node: locus_info
    | int_info
    | TAGS? "{" nodes "}" -> subnodes
    | TAGS                -> onlytags
nodes: node?
    | node ("," node)*
STRAND_INFO: "strand" SIGN
SIGN: "plus" | "minus"
TAGS: TAGWORD (WS TAGWORD)*
TAGWORD: ("_"|LETTER)("_"|"-"|LETTER|DIGIT)*
%import common.WS
%import common.LETTER
%import common.DIGIT
%import common.INT
%ignore WS
"""

parser = Lark(grammar, start="thing", ambiguity="explicit")
parsed = parser.parse(text)
print(parsed.pretty())

输出：

thing
  subnodes
    nodes
      subnodes
        loc int
        nodes
          node
            int_info
              from
              0
          node
            int_info
              to
              1093
          onlytags  strand plus
          node
            int_info
              id gi
              384632836

如本例所示，该ambiguity="explicit"选项应该能够显示替代匹配的可能性，前面有一个_ambig标签。这没有出现在上面的输出中。似乎我不明白模棱两可是什么。

为什么“链加”不被认为是模棱两可的？在我看来，它可以与STRAND_INFO或匹配onlytags。

同样，我希望 "loc int {...}" 与locus_infoor匹配subnodes。

python - 了解什么是云雀语法中的歧义

0 回答 0

Related

Reference