python - 通过 Lark 解析获取下一个可能的令牌

Question

我想知道是否有一种方法可以通过 Lark 解析获取给定字符串和给定语法的下一个可能标记。

例如，如果我有语法。

?start: NAME "=" possible_values
possible_values: "apple" | "banana" | "orange"

我输入字符串“my_variable =”

下一个可能的标记是"apple", "banana" or "orange".

是否有任何内置功能可以帮助我实现这一目标？

score 1 · Accepted Answer

实际上是的，在最新版本 (0.11.3) 中添加。

它被称为InteractiveParser/Lark.parse_interactive它目前仅适用于parser='lalr'并且接口可能会更改到版本 1.0 。

它可以这样使用：

from lark import Lark

parser = Lark(r"""
?start: NAME "=" possible_values
possible_values: "apple" | "banana" | "orange"
NAME: /\w+/
%ignore /\s+/
""", parser="lalr")

interactive = parser.parse_interactive("my_variable = ")

# feeds the text given to above into the parsers. This is not done automatically.
interactive.exhaust_lexer()


# returns the names of the Terminals that are currently accepted.
print(interactive.accepts())

请注意，它会accepts返回一个终端名称列表，这些名称大多很有帮助，但可能是自动生成的，没有那么有用（类似于__ANON_0）。实际定义可以通过访问parser.terminals，这是一个列表，您必须从中提取正确的定义：

term_name = "BANANA"

term_def = next(t for t in parser.terminals if t.name==term_name)

print(term_def.name)
print(term_def.pattern)

这是关于InteractiveParser

_{（为了将来更快的答案，请在gitter上发布指向您的 SO 问题的链接）}

python - 通过 Lark 解析获取下一个可能的令牌

1 回答 1

Related

Reference