我正在使用 minidom 来解析 xml 文档。我用 yum 标签获取数据并将它们存储在一个列表中并计算单词的频率。但是,它不会将它们作为字符串存储或读取到列表中。还有另一种方法吗?现在这就是我所拥有的:
yumNodes = [node for node in doc.getElementsByTagName("yum")]
for node in yumNodes:
yumlist.append(t.data for t in node.childNodes if t.nodeType == t.TEXT_NODE)
for ob in yumlist:
for o in ob:
if word not in freqDict:
freqDict[word] = 1
else:
freqDict[word] += 1