我正在使用 Ruamel Python 库以编程方式编辑人工编辑的 YAML 文件。
我很难理解如何将评论插入结构化数据。
我有一些数据:
a:
b: banana
c: apple
d: orange
我想添加评论和新密钥:
a:
b: banana
c: apple
d: orange
# This is my comment
e: pear
是否可以使用 来做到这一点ruamel.yaml
,如果可以,怎么做?
我正在使用 Ruamel Python 库以编程方式编辑人工编辑的 YAML 文件。
我很难理解如何将评论插入结构化数据。
我有一些数据:
a:
b: banana
c: apple
d: orange
我想添加评论和新密钥:
a:
b: banana
c: apple
d: orange
# This is my comment
e: pear
是否可以使用 来做到这一点ruamel.yaml
,如果可以,怎么做?
是的,这是可能的,因为您可以通过往返来检查:
import sys
import ruamel.yaml
with open('your_input.yaml') as fp:
data = ruamel.yaml.round_trip_load(yaml_str)
ruamel.yaml.round_trip_dump(data, sys.stdout)
打印的输出将与您的输入相匹配,因此以某种方式将注释插入到结构的data
层次结构中,保存并在转储时写出。
在注释中附加到或s 的ruamel.yaml
包装类,您可以使用 进行检查:它是(from )。您可以通过属性访问的属性挂起值的注释信息:lists
dict
print(type(data['a'])
CommentedMap
ruamel.yaml.comment.py
a
_yaml_comment
ca
cm = data['a']
print(cm.ca)
给出:
items={'e': [None, [CommentToken(value='# This is my comment\n')], None, None]})
这表明注释与键相关联e
,即在注释之后。不幸的是,CommentToken
不能仅仅通过调用它来创建它,就像它所代表的那样(即CommentToken(value='# This is my comment\n')
),它需要更多的工作,因为它至少需要一个 start Mark
。
没有“帮助”例程来创建这样的评论,但通过查看CommentedMap
它的基类CommentedBase
,您可以提出以下 ¹:
import sys
import ruamel.yaml
if not hasattr(ruamel.yaml.comments.CommentedMap, "yaml_set_comment_before_key"):
def my_yaml_set_comment_before_key(self, key, comment, column=None,
clear=False):
"""
append comment to list of comment lines before key, '# ' is inserted
before the comment
column: determines indentation, if not specified take indentation from
previous comment, otherwise defaults to 0
clear: if True removes any existing comments instead of appending
"""
key_comment = self.ca.items.setdefault(key, [None, [], None, None])
if clear:
key_comment[1] = []
comment_list = key_comment[1]
if comment:
comment_start = '# '
if comment[-1] == '\n':
comment = comment[:-1] # strip final newline if there
else:
comment_start = '#'
if column is None:
if comment_list:
# if there already are other comments get the column from them
column = comment_list[-1].start_mark.column
else:
column = 0
start_mark = ruamel.yaml.error.Mark(None, None, None, column, None, None)
comment_list.append(ruamel.yaml.tokens.CommentToken(
comment_start + comment + '\n', start_mark, None))
return self
ruamel.yaml.comments.CommentedMap.yaml_set_comment_before_key = \
my_yaml_set_comment_before_key
使用CommentedMap
此方法进行扩展后,您可以执行以下操作:
yaml_str = """\
a:
b: banana
c: apple
d: orange
e: pear
"""
data = ruamel.yaml.round_trip_load(yaml_str)
cm = data['a']
cm.yaml_set_comment_before_key('e', "This is Alex' comment", column=2)
cm.yaml_set_comment_before_key('e', 'and this mine')
ruamel.yaml.round_trip_dump(data, sys.stdout)
要得到:
a:
b: banana
c: apple
d: orange
# This is Alex' comment
# and this mine one
e: pear
除非您阅读评论,否则无法查询cm
评论应该在哪一列,以将其与键对齐e
(该列是在写出数据结构时确定的)。您可能很想存储一个特殊值 ( -1
?) 并尝试在输出期间确定这一点,但在流出时您几乎没有上下文。您当然可以将列确定/设置为嵌套级别 ( 1
) 并将其乘以缩进量(您给出的缩进round_trip_dump
,默认为2
)
注释工具是为了在往返中保存,而不是最初用于修改或插入新的,因此不能保证界面是稳定的。考虑到这一点,请确保您创建一个或一组例程yaml_set_comment_before_key()
来进行更改,因此如果界面发生更改,您只有一个模块可以更新(能够附加评论的能力不会消失, 但这样做的方法可能会改变)
¹也许不是你,但由于我是ruamel.yaml的作者,我应该能够在文档不足的代码中找到自己的方式。