4

我有一个 YAML 文件,想限制某个字段不包含空格。

这是一个演示我尝试的脚本:

测试.py

#!/usr/bin/env python3

import os
from ruamel import yaml

def read_conf(path_to_config):
    if os.path.exists(path_to_config):
        conf = open(path_to_config).read()
        return yaml.load(conf)
    return None

if __name__ == "__main__":
    settings = read_conf("hello.yaml")
    print("type of name: {0}, repr of name: {1}".format(type(
             settings['foo']['name']), repr(settings['foo']['name'])))
    if any(c.isspace() for c in settings['foo']['name']):
        raise Exception("No whitespace allowed in name!")

这是我对 YAML 文件的第一个剪辑:

你好.yaml

foo:
    name: "hello\t"

在上述 YAML 文件中,正确引发了异常:

type of name: <class 'str'>, repr of name: 'hello\t'
Traceback (most recent call last):
  File "./test.py", line 16, in <module>
    raise Exception("No whitespace allowed in name!")
Exception: No whitespace allowed in name!

但是,如果我将双引号更改为单引号,则不会引发异常:

08:23 $ ./test.py 
type of name: <class 'str'>, repr of name: 'hello\\t'

使用ruamel.yaml==0.11.11和时都会发生此行为PyYAML=3.11

为什么在这些 Python YAML 解析器中的单引号和双引号之间存在差异,而据我所知,在 YAML 规范中它们之间没有功能差异?如何防止特殊字符被转义?

4

1 回答 1

6

YAML 规范中单引号和双引号字符串之间存在巨大差异。在单引号标量中,您只能转义单引号:

单引号样式由周围的“'”指示符指定。因此,在单引号标量内,此类字符需要重复。这是在单引号标量中执行的唯一转义形式。

因此\in 'hello\t'没有特殊功能,并且该标量由字母h, e, l(2x),组成o\t

反斜杠转义仅在双引号 YAML 标量中受支持。

于 2016-07-05T12:42:13.873 回答