1

如果我将此添加到脚本的开头:

$KCODE = 'UTF8'
require 'jcode'

然后我可以遍历包含 unicode 字符的单词的每个字符。想象一个包含变音符号或其他东西的单词,我像这样迭代它们:

word.each_char do |c|
  # do something with c
end

如果c是一个 unicode 字符并且我打印它的大小,它将是 2(由 2 个字符组成)。我怎样才能得到c's 的代码?有没有我可以使用的公式,或者标准库中有什么东西可以做到这一点?

4

1 回答 1

3

应该:

c.unpack('U*').first
于 2010-01-18T13:33:09.050 回答