我正在尝试使用 lxml 遍历 XML 文件(UTF-8 编码,以 开头),但在字符丂上出现以下错误:
UnicodeEncodeError: 'cp932' codec can't encode character u'\u4e02' in position 0: 非法多字节序列
在此之前的其他字符被正确打印出来。代码是:
parser = etree.XMLParser(encoding='utf-8')
tree = etree.parse("filename.xml", parser)
root = tree.getroot()
for elem in root:
print elem[0].text
该错误是否意味着它没有在 utf-8 中解析文件,而是在 shift JIS 中解析文件?