2

我正在尝试将数据集的 XML 文件 HMDB 解析为字典Saliva Metabolites列表。这样做,使用xmldict包。我尝试创建的数据格式和输出结构首先在发布的预览问题中编码段落。

这是代码:

# Import packages
import xml.etree.ElementTree as et
import xmltodict

# load data
data1 = et.parse('D:/path/To/Projects/HMDB/DataSets/saliva_metabolites/saliva_metabolites.xml')
root = data1.getroot()

xmlstr = et.tostring(root, encoding='utf-8', method='xml')
data_dict = dict(xmltodict.parse(xmlstr))

现在,当尝试访问特定键时,例如:

>> data_dict['ns0:hmdb']
Traceback (most recent call last):
  File "<input>", line 1, in <module>
MemoryError

我正在使用 Pycharm 并在注意到的对象旁边data_dict写着:Unable to get repr for <class 'dict'>

不知道我的系统还需要什么其他信息:

>> print(sys.version)
3.8.5 (tags/v3.8.5:580fbb0, Jul 20 2020, 15:43:08) [MSC v.1926 32 bit (Intel)]

任何想法,提示或线索将不胜感激

4

0 回答 0