所以我在一个 XML 文件中有这个 UTF-8 字符串:
Horrible place. ☠☠☠
当我将它提供给外部应用程序时,有趣的字符会作为 XML 实体转义回来:
Horrible place. ☠☠☠
在 Ruby 中,如何将该字符串转换回 UTF-8?可能有一个非常简单的解决方案,但是我在标准库中找不到任何东西;例如。CGI.unescapeHTML
(这对于像这样的东西很好用>
)似乎完全忽略了它们。
ree-1.8.7-2010.02 > CGI.unescapeHTML('>')
=> ">"
ree-1.8.7-2010.02 > CGI.unescapeHTML('☠')
=> "☠"