-2

如何将 minidom 实例配置为具有 unicode 编解码器?

在 XML 文件中处理此代码段:

<title type="text">ME850单片机开发实验仪(增强配置)(产品浏览)-伟纳电子-http://www.willar.com/</title>

产生此错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-12: ordinal not in range(128)

更新:在 Python 3 中按预期工作;显然这是 2.x 的已知限制。

4

2 回答 2

4

在 Python 2.x 中,minidom 只能解析字节字符串。要么首先不解码您的文档(提示:更具体的建议需要您正在运行的代码),要么将其编码为 UTF-8。

或者,您可以切换到 Python 3.x,其中 minidom 可以处理字节以及字符串。

于 2012-08-06T19:50:28.017 回答
0

您可以使用:

str.encode('utf-8')
于 2013-07-11T12:25:42.333 回答