1

我正在尝试使用 Ruby 1.9.3pl194转义包含用于 JSON和 logfile的非 ASCII Unicode 字符的字符串。消耗 JSON 的东西不能处理非 ASCII,所以我需要生成一个转义版本,但是......

a = "Abc\u00eddef"
puts a
puts a.inspect

产生:

Abcídef
"Abc\u00EDdef"

请注意,第二个输出包含不需要的双引号,我不想要引号,因为我只想将字符串写入Abc\u00eddef文件;它不仅仅用于 JSON 字符串。

如果我尝试使用,也会发生同样的事情ActionSupport::JSON.decode(b)

我知道我能做到

puts a.inspect[1..-2]

但这有点难看,肯定有一种方法可以做到这一点而不必去掉引号?

它是普通的旧 Ruby,所以我没有.html_safe在 rails 中使用它(不确定这是否可行)。

4

1 回答 1

0

以下是 ActiveSupport 解决问题的方法

def escape(string)
  string = string.encode(::Encoding::UTF_8, :undef => :replace).force_encoding(::Encoding::BINARY)
  json = string.
    gsub(escape_regex) { |s| ESCAPED_CHARS[s] }.
    gsub(/([\xC0-\xDF][\x80-\xBF]|
           [\xE0-\xEF][\x80-\xBF]{2}|
           [\xF0-\xF7][\x80-\xBF]{3})+/nx) { |s|
    s.unpack("U*").pack("n*").unpack("H*")[0].gsub(/.{4}/n, '\\\\u\&')
  }
  json = %("#{json}")
  json.force_encoding(::Encoding::UTF_8)
  json
end

如您所见,这不是微不足道的!因此,最好的解决方案可能是使用ActiveSupport::JSON.encode(whatever)并去掉引号(如果你真的必须的话)。

于 2012-10-04T19:45:03.427 回答