1

我有一个 xml 文件,其中包含一些属性的希伯来语内容。我在python中做:

parser = ET.XMLParser(encoding="utf-8")
tree = ET.parse(fInput,parser)
root = tree.getroot()

从那里我可以遍历 len(root) 对象,并开始使用 .text 属性处理它。但是,对于我得到的希伯来文文本,例如,

>>> elem[0].text
u'\u05ea\u05d5\u05dd'

我希望将此 xml 转换为 SQL 插入函数,以便将其插入到我的数据库中。我怎样才能正确读取这些属性,以便真正掌握希伯来语字符串?

4

1 回答 1

1

Unicode 字符 05ea 是希伯来字母 Tav或 ת,因此看起来您正在正确阅读 UTF-8 编码的希伯来文本。完整的字符串是"תום"。您所要做的就是确保将您写入的数据库字段配置为 UTF-8 或 UTF-16。

于 2013-07-29T18:38:34.183 回答