我正在尝试将数据从 XML 文件转换为 python dict,但无法这样做。以下是我正在编写的代码。
import xmltodict
input_xml = 'data.xml' # This is the source file
with open(input_xml, encoding='utf-8', errors='ignore') as _file:
data = _file.read()
data = xmltodict.parse(data,'ASCII')
print(data)
exit()
在执行此代码时,以下是我得到的错误:
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 239, column 40.
经过多次点击和试验,我意识到我的 xml 在特定标签内有一些印地语字符,如下所示
<DECL>!! आप की सेवा में पुनः पधारे !!</DECL>
在运行之前如何忽略这些未编码的字符xmltodict.parse
?