0

即使问题的主题看起来很复杂,问题也很简单。

我使用以下脚本创建了一个 XML 文件:

def xmlFile = new File("file-${System.currentTimeMillis()}.xml")
mb = new groovy.xml.StreamingMarkupBuilder()
mb.encoding = "UTF-8"
new FileWriter(xmlFile) << mb.bind {
    mkp.xmlDeclaration()
    out << "\n"
    someMarkup {}
}

然后,当我使用以下代码解析此文件时:

def xml = new XmlSlurper().parse(xmlFile)

我得到以下MalformedByteSequenceException异常:

抛出异常:3 字节 UTF-8 序列的字节 2 无效

如果我将文件转换为 UTF-8 格式(例如使用 Notepad++),那么一切正常。

那么,我该怎么做才能以 UTF-8 格式保存我的文件呢?为什么代码mb.encoding = "UTF-8"不这样做?

谢谢

4

1 回答 1

2

您需要在 FileOutputStream 周围包装一个输出流编写器是 utf-8 不是默认字符集

new OutputStreamWriter(new FileOutputStream(exportXmlFile),'utf-8') << mb.bind {
    mkp.xmlDeclaration()
    out << "\n"
    someMarkup {}
}

我不确定 mb.encoding 的设置是做什么的,可能只是在 xml 标头中设置字符集

于 2009-10-07T00:17:04.283 回答