我有一个解析 xml 文件并返回以下错误的 python 脚本:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 614617: character maps to <undefined>
我很确定错误正在发生,因为我试图解析的 xml 文档中有一些非法字符,但是我无权直接修复我正在读取的这个特定的 xml 文件。
我是否能够拥有它,以便这些字符不会绊倒我的脚本并允许它继续解析而不会出错?
这是 tat 正在读取 xml 并对其进行解码的脚本的一部分:
def ReadXML(self, path):
self.logger.info("Reading XML from %s" % path)
codec = "Windows-1252"
xmlReader = open(path, "r")
return xmlReader.read().decode(codec)