-1

问题:

# From example at https://github.com/lark-parser/lark/blob/master/examples/json_parser.py
from lark import Lark, Transformer, v_args
parse = json_parser.parse
json_grammar = r""" ... """
### Create the JSON parser with Lark, using the LALR algorithm
json_parser = Lark(json_grammar, parser='lalr',
                   # Using the standard lexer isn't required, and isn't usually recommended.
                   # But, it's good enough for JSON, and it's slightly faster.
                   lexer='standard',
                   # Disabling propagate_positions and placeholders slightly improves speed
                   propagate_positions=False,
                   maybe_placeholders=False,
                   # Using an internal transformer is faster and more memory efficient
                   transformer=TreeToJson())

with open(sys.argv[1]) as f:
    tree = parse(f.read())
    print( tree )
    # Errors next 2 lines:
    # No: tree.pretty( indent_str="  " )
    # No: Lark.pretty( indent_str="  " )

具体错误:

  • AttributeError:类型对象'Lark'没有属性'pretty'

设置:

Python 版本 = 3.8.1

在 Mac Bug Sur 上的 Miniconda 3 中

conda install lark-parser

安装 0.11.2-pyh44b312d_0

conda upgrade lark-parser

安装 0.11.3-pyhd8ed1ab_0

编辑:注意我的目标:

这里的目标不仅仅是解析 JSON;我只是碰巧正在使用一个 JSON 示例来尝试和学习。我想为我在工作中处理的一些数据编写自己的语法。

编辑:为什么我相信漂亮的印刷品应该存在:

这是一个使用 .pretty() 函数的示例,甚至包括输出。但我似乎找不到任何包含 .pretty() 的内容(至少通过 conda):http: //github.com/lark-parser/lark/blob/master/docs/json_tutorial.md

4

2 回答 2

2

我不确定我可以在这个答案中加入其他答案中没有的内容。我将尝试创建相应的示例:

json_parser = Lark(json_grammar, parser='lalr',
                   # Using the standard lexer isn't required, and isn't usually recommended.
                   # But, it's good enough for JSON, and it's slightly faster.
                   lexer='standard',
                   # Disabling propagate_positions and placeholders slightly improves speed
                   propagate_positions=False,
                   maybe_placeholders=False,
                   # Using an internal transformer is faster and more memory efficient
                   transformer=TreeToJson()
)

这里重要的一行是transformer=TreeToJson(). 它告诉 Lark 在TreeToJson将树返回给您之前应用 Transformer 类。如果删除该行:

json_parser = Lark(json_grammar, parser='lalr',
                   # Using the standard lexer isn't required, and isn't usually recommended.
                   # But, it's good enough for JSON, and it's slightly faster.
                   lexer='standard',
                   # Disabling propagate_positions and placeholders slightly improves speed
                   propagate_positions=False,
                   maybe_placeholders=False,
)

然后您Tree使用以下方法获取实例.pretty

tree = json_parser.parse(test_json)
print(tree.pretty())

然后,您可以Transformer手动应用:

res = TreeToJson().transform(tree)

这现在是一个“普通”python 对象,就像你从 stdlib json 模块中获得的一样,所以可能是一个dictonary。

构造的transformer=选项Lark使它可以在创建树之前完成,从而节省时间和内存。

于 2021-05-12T07:17:19.760 回答
1

Lark 示例目录中的 JSON 解析器使用树转换器将解析后的树转换为普通的 JSON 对象。这使得可以通过将其与 Python 标准库中的 JSON 解析器进行比较来验证解析是否正确:

    j = parse(test_json)
    print(j)
    import json
    assert j == json.loads(test_json)

仅当返回的值与返回的对象具有相同类型assert时,最后才能通过,这是一个普通的朴素的Python内置类型,通常是或。parsejson.loadsdictarray

您可能会发现Python 标准库中的漂亮打印机对这个特定的应用程序很有用。或者您可以使用带有非零关键字参数的内置JSON.dumps函数。indent(例如print(json.dumps(json_value, indent=2)):)

于 2021-05-11T22:34:22.233 回答