如果我将此添加到脚本的开头:
$KCODE = 'UTF8'
require 'jcode'
然后我可以遍历包含 unicode 字符的单词的每个字符。想象一个包含变音符号或其他东西的单词,我像这样迭代它们:
word.each_char do |c|
# do something with c
end
如果c
是一个 unicode 字符并且我打印它的大小,它将是 2(由 2 个字符组成)。我怎样才能得到c
's 的代码?有没有我可以使用的公式,或者标准库中有什么东西可以做到这一点?