即使问题的主题看起来很复杂,问题也很简单。
我使用以下脚本创建了一个 XML 文件:
def xmlFile = new File("file-${System.currentTimeMillis()}.xml")
mb = new groovy.xml.StreamingMarkupBuilder()
mb.encoding = "UTF-8"
new FileWriter(xmlFile) << mb.bind {
mkp.xmlDeclaration()
out << "\n"
someMarkup {}
}
然后,当我使用以下代码解析此文件时:
def xml = new XmlSlurper().parse(xmlFile)
我得到以下MalformedByteSequenceException
异常:
抛出异常:3 字节 UTF-8 序列的字节 2 无效
如果我将文件转换为 UTF-8 格式(例如使用 Notepad++),那么一切正常。
那么,我该怎么做才能以 UTF-8 格式保存我的文件呢?为什么代码mb.encoding = "UTF-8"
不这样做?
谢谢