0

有人可以帮我理解这个 Ruby 脚本在做什么吗?

def clean_up dirty_text
  newstr = ""

  dirty_text.each_byte do |byte|
    newstr << if byte < 0x80
      byte.chr
    elsif byte < 0xC0
      "\xC2" + byte.chr
    else
      "\xC3" + (byte - 64).chr      
    end
  end

  newstr
end
4

1 回答 1

1

这是将 Latin-1 转码为 UTF-8 的一种粗鲁方式。

“每个软件开发人员绝对、肯定必须了解 Unicode 和字符集的绝对最低要求(没有借口!)”

于 2012-07-17T04:21:41.317 回答