0

我有一个包含希伯来语字符的 XML,但是当在屏幕上键入(Windows 'CAT')时 - 它显示 Gibrish。所以,我安装了 Console2 并将编码 (chcp) 更改为 862 或 1255,然后它显示得很好,但是,当尝试使用 Nokogiri 或 REXML 解析它时 - 它会引发异常 - “格式错误的 xml:缺少标签开始” .

因此,如果有人知道如何摆脱这种混乱,可以指导我在哪种编码中保存什么,并完成这项工作,因为我在没有合适的解决方案的情况下搜索了整个 Web。

我正在使用 Windows XP 32 位。我的 Ruby IDE 是 Aptana 3,Ruby 版本是 1.8.7

任何人都可以在这里帮助我吗?

4

1 回答 1

1

众所周知,Ruby 1.8.7 存在编码问题。这里有一个类似的问题(请参阅“在 Ruby 1.8.7 或 1.9.2 中编码”),它可以帮助您找到方法。所以安装 gemcharacter-encodings并在你的 ruby​​ 文件中使用它。然后为您要处理的字符串添加前缀u'myStrüng'(我在这里使用了德语变音符号作为示例)。

于 2011-09-11T07:59:19.390 回答