4

我想检查一个字符串是否是有效的 YAML。我想在我的 Ruby 代码中使用 gem 或库来执行此操作。我只有这个开始/救援子句,但它没有得到正确救援:

def valid_yaml_string?(config_text)
  require 'open-uri'
  file = open("https://github.com/TheNotary/the_notarys_linux_mint_postinstall_configuration")
  hard_failing_bad_yaml = file.read
  config_text = hard_failing_bad_yaml
  begin
    YAML.load config_text
    return true
  rescue
    return false
  end
end

不幸的是,我遇到了以下严重错误:

irb(main):089:0> valid_yaml_string?("b")
Psych::SyntaxError: (<unknown>): mapping values are not allowed in this context at line 6 column 19
from /home/kentos/.rvm/rubies/ruby-1.9.3-p374/lib/ruby/1.9.1/psych.rb:203:in `parse'
from /home/kentos/.rvm/rubies/ruby-1.9.3-p374/lib/ruby/1.9.1/psych.rb:203:in `parse_stream'
from /home/kentos/.rvm/rubies/ruby-1.9.3-p374/lib/ruby/1.9.1/psych.rb:151:in `parse'
from /home/kentos/.rvm/rubies/ruby-1.9.3-p374/lib/ruby/1.9.1/psych.rb:127:in `load'
from (irb):83:in `valid_yaml_string?'
from (irb):89
from /home/kentos/.rvm/rubies/ruby-1.9.3-p374/bin/irb:12:in `<main>'
4

1 回答 1

8

使用代码的清理版本:

require 'yaml'
require 'open-uri'

URL = "https://github.com/TheNotary/the_notarys_linux_mint_postinstall_configuration"

def valid_yaml_string?(yaml)
  !!YAML.load(yaml)
rescue Exception => e
  STDERR.puts e.message
  return false
end

puts valid_yaml_string?(open(URL).read)

我得到:

(<unknown>): mapping values are not allowed in this context at line 6 column 19
false

当我运行它时。

原因是,您从该 URL 获得的数据根本不是 YAML,而是 HTML:

open('https://github.com/TheNotary/the_notarys_linux_mint_postinstall_configuration').read[0, 100]
=> "  \n\n\n<!DOCTYPE html>\n<html>\n  <head prefix=\"og: http://ogp.me/ns# fb: http://ogp.me/ns/fb# githubog:"

如果您只想要一个真/假响应(无论它是可解析的 YAML),请删除此行:

STDERR.puts e.message

不幸的是,超出此范围并确定字符串是否为 YAML 字符串变得更加困难。你可以做一些嗅探,寻找一些提示:

yaml[/^---/m]

将搜索 YAML“文档”标记,但 YAML 文件不必使用这些标记,它们也不必位于文件的开头。我们可以添加它来加强测试:

!!YAML.load(yaml) && !!yaml[/^---/m]

但是,即使这样也会留下一些漏洞,因此添加一个测试以查看解析器返回的内容可以提供更多帮助。YAML 可以返回 Fixnum、String、Array 或 Hash,但如果您已经知道会发生什么,您可以查看 YAML 想要返回的内容。例如:

YAML.load(({}).to_yaml).class
=> Hash
YAML.load(({}).to_yaml).instance_of?(Hash)
=> true

所以,你可以寻找一个哈希:

parsed_yaml = YAML.load(yaml)
!!yaml[/^---/m] && parsed_yaml.instance_of(Hash) 

替换Hash为您认为应该获得的任何类型。

可能有更好的方法来嗅出它,但这些是我首先要尝试的。

于 2013-05-02T01:49:57.767 回答