我似乎是一个非常简单且非常需要的方法。我需要从字符串中删除所有非 ASCII 字符。例如 © 等。请参见以下示例。
#coding: utf-8
s = " Hello this a mixed string © that I made."
puts s.encoding
puts s.encode
输出:
UTF-8
Hello this a mixed str
我做的┬⌐。
当我将此提供给 Watir 时,它会产生以下错误:不兼容的字符编码:UTF-8 和 ASCII-8BIT
所以我的问题是我想在使用它之前摆脱所有非 ASCII 字符。我不知道源字符串“s”使用哪种编码。
我已经搜索和试验了很长一段时间了。
如果我尝试使用
puts s.encode('ASCII-8BIT')
它给出了错误:
: "\xC2\xA9" from UTF-8 to ASCII-8BIT (Encoding::UndefinedConversionError)