我们使用 CMS,在编码方面使用起来真的很痛苦,但我仍然需要为它生成一个结构。
我将:设置Encoding.default_internal
为 UTF-8,我尝试使用# Encoding: UTF-8
并编写了文件,File.open("filename", "w:UTF-8")
但我总是得到这样的结果:
DOMDocument::loadXML() [domdocument.loadxml]: Input is not proper UTF-8, indicate encoding ! Bytes: 0xF6 0x6A 0xE4 0x6B in Entity, line: 7DOMDocument::loadXML() [domdocument.loadxml]: Empty string supplied as input
该文件包含öäü
,如果我删除它们,它会像预期的那样工作。
如果我使用 Notepad++ 功能“转换为没有 BOM 的 UTF-8”并在其中手动写入“元音变音(öäü)”,它就可以工作。
将值更改为 HTML 实体(如ö
, )是没有选择的,因为它们会以这种方式出现在后端。
PS:它是用 JRuby 编写的。