4

我正在使用来自http://pyyaml.org的 YAML 解析器,我希望它始终将某些字段解释为字符串,但我无法弄清楚 add_path_resolver() 是如何工作的。

例如:解析器假定“版本”是一个浮点数:

network:
- name: apple
- name: orange
version: 2.3
site: banana

某些文件具有“版本:2”(被解释为 int)或“版本:2.3 alpha”(被解释为 str)。

我希望它们始终被解释为 str。

似乎 yaml.add_path_resolver() 应该让我指定,“当你看到版本时:,总是将它解释为一个 str)但它没有很好地记录。我最好的猜测是:

yaml.add_path_resolver(u'!root', ['version'], kind=str)

但这不起作用。

关于如何让我的版本字段始终为字符串的建议?

PS 以下是一些不同“版本”字符串的示例以及它们的解释方式:

(Pdb) import yaml
(Pdb) import pprint
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': 2}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': 2.2999999999999998}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3 alpha\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': '2.3 alpha'}
4

2 回答 2

2

从当前来源:

 # Note: `add_path_resolver` is experimental.  The API could be changed.

看来它还不完整(还没有?)。可行的语法(据我所知)是

yaml.add_path_resolver(u'tag:yaml.org,2002:str', ['version'], yaml.ScalarNode)

然而,事实并非如此。

似乎首先检查隐式类型解析器,如果一个匹配,那么它永远不会检查用户定义的解析器。有关更多详细信息,请参见resolver.py(查找函数resolve)。

我建议将您的version条目更改为

version: !!str 2.3

这将始终将其强制为字符串。

于 2010-11-11T03:31:42.833 回答
1

到目前为止,最简单的解决方案不是使用基本的.load()(无论如何这都是不安全的),而是使用它Loader=BaseLoader,它将每个标量加载为字符串:

import yaml

yaml_str = """\
network:
- name: apple
- name: orange
version: 2.3
old: 2
site: banana
"""

data = yaml.load(yaml_str, Loader=yaml.BaseLoader)
print(data)

给出:

{'network': [{'name': 'apple'}, {'name': 'orange'}], 'version': '2.3', 'old': '2', 'site': 'banana'}
于 2017-08-15T15:07:36.940 回答