#coding: utf-8
str2 = "asdfМикимаус"
p str2.encoding #<Encoding:UTF-8>
p str2.scan /\p{Cyrillic}/ #found all cyrillic characters
str2.gsub!(/\w/u,'') #removes only latin characters
puts str2
问题是为什么\w
忽略西里尔字符?
我已经从http://rubyinstaller.org/安装了最新的 ruby 包。这是我的输出ruby -v
ruby 1.9.1p378 (2010-01-10 revision 26273) [i386-mingw32]
据我所知 1.9 oniguruma 正则表达式库完全支持 unicode 字符。