我有一个带有俄语文本的 XML 文件:
<p>все чашки имеют стандартный посадочный диаметр - 22,2 мм</p>
我xml.etree.ElementTree
过去常常以各种方式对其进行操作(从未接触过文本内容)。然后,我使用ElementTree.tostring
:
info["table"] = ET.tostring(table, encoding="utf8") #table is an Element
然后我用这个字符串做一些其他的事情,最后把它写到一个文件中
f = open(newname, "w")
output = page_template.format(**info)
f.write(output)
f.close()
我在我的文件中结束了这个:
<p>\xd0\xb2\xd1\x81\xd0\xb5 \xd1\x87\xd0\xb0\xd1\x88\xd0\xba\xd0\xb8 \xd0\xb8\xd0\xbc\xd0\xb5\xd1\x8e\xd1\x82 \xd1\x81\xd1\x82\xd0\xb0\xd0\xbd\xd0\xb4\xd0\xb0\xd1\x80\xd1\x82\xd0\xbd\xd1\x8b\xd0\xb9 \xd0\xbf\xd0\xbe\xd1\x81\xd0\xb0\xd0\xb4\xd0\xbe\xd1\x87\xd0\xbd\xd1\x8b\xd0\xb9 \xd0\xb4\xd0\xb8\xd0\xb0\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80 - 22,2 \xd0\xbc\xd0\xbc</p>
如何正确编码?