3

我正在使用 Ruamel Python 库以编程方式编辑人工编辑的 YAML 文件。

我很难理解如何将评论插入结构化数据。

我有一些数据:

a:
  b: banana
  c: apple
  d: orange

我想添加评论和新密钥:

a:
  b: banana
  c: apple
  d: orange
  # This is my comment
  e: pear

是否可以使用 来做到这一点ruamel.yaml,如果可以,怎么做?

4

1 回答 1

8

是的,这是可能的,因为您可以通过往返来检查:

import sys
import ruamel.yaml

with open('your_input.yaml') as fp:
    data = ruamel.yaml.round_trip_load(yaml_str)
ruamel.yaml.round_trip_dump(data, sys.stdout)

打印的输出将与您的输入相匹配,因此以某种方式将注释插入到结构的data层次结构中,保存并在转储时写出。

在注释中附加到或s 的ruamel.yaml包装类,您可以使用 进行检查:它是(from )。您可以通过属性访问的属性挂起值的注释信息:listsdictprint(type(data['a'])CommentedMapruamel.yaml.comment.pya_yaml_commentca

cm = data['a']
print(cm.ca)

给出:

items={'e': [None, [CommentToken(value='# This is my comment\n')], None, None]})

这表明注释与键相关联e,即在注释之后。不幸的是,CommentToken不能仅仅通过调用它来创建它,就像它所代表的那样(即CommentToken(value='# This is my comment\n')),它需要更多的工作,因为它至少需要一个 start Mark

没有“帮助”例程来创建这样的评论,但通过查看CommentedMap它的基类CommentedBase,您可以提出以下 ¹:

import sys
import ruamel.yaml

if not hasattr(ruamel.yaml.comments.CommentedMap, "yaml_set_comment_before_key"):
    def my_yaml_set_comment_before_key(self, key, comment, column=None,
                                       clear=False):
        """
        append comment to list of comment lines before key, '# ' is inserted
            before the comment
        column: determines indentation, if not specified take indentation from
                previous comment, otherwise defaults to 0
        clear: if True removes any existing comments instead of appending
        """
        key_comment = self.ca.items.setdefault(key, [None, [], None, None])
        if clear:
            key_comment[1] = []
        comment_list = key_comment[1]
        if comment:
            comment_start = '# '
            if comment[-1] == '\n':
                comment = comment[:-1]  # strip final newline if there
        else:
            comment_start = '#'
        if column is None:
            if comment_list:
                 # if there already are other comments get the column from them
                column = comment_list[-1].start_mark.column
            else:
                column = 0
        start_mark = ruamel.yaml.error.Mark(None, None, None, column, None, None)
        comment_list.append(ruamel.yaml.tokens.CommentToken(
            comment_start + comment + '\n', start_mark, None))
        return self

    ruamel.yaml.comments.CommentedMap.yaml_set_comment_before_key = \
        my_yaml_set_comment_before_key

使用CommentedMap此方法进行扩展后,您可以执行以下操作:

yaml_str = """\
a:
  b: banana
  c: apple
  d: orange
  e: pear
"""

data = ruamel.yaml.round_trip_load(yaml_str)
cm = data['a']

cm.yaml_set_comment_before_key('e', "This is Alex' comment", column=2)
cm.yaml_set_comment_before_key('e', 'and this mine')
ruamel.yaml.round_trip_dump(data, sys.stdout)

要得到:

a:
  b: banana
  c: apple
  d: orange
  # This is Alex' comment
  # and this mine one
  e: pear

除非您阅读评论,否则无法查询cm评论应该在哪一列,以将其与键对齐e(该列是在写出数据结构时确定的)。您可能很想存储一个特殊值 ( -1?) 并尝试在输出期间确定这一点,但在流出时您几乎没有上下文。您当然可以将列确定/设置为嵌套级别 ( 1) 并将其乘以缩进量(您给出的缩进round_trip_dump,默认为2

注释工具是为了在往返中保存,而不是最初用于修改或插入新的,因此不能保证界面是稳定的。考虑到这一点,请确保您创建一个或一组例程yaml_set_comment_before_key()来进行更改,因此如果界面发生更改,您只有一个模块可以更新(能够附加评论的能力不会消失, 但这样做的方法可能会改变)


¹也许不是你,但由于我是ruamel.yaml的作者,我应该能够在文档不足的代码中找到自己的方式。

于 2016-10-01T06:34:23.487 回答