全部 -
我正在尝试使用以下非常简单的 XML 文档结构来解析
from xml.dom.minidom import parse
XML 如下所示:
<?xml version="1.0" encoding="utf-8"?>
<list>
<file name="..." url="...">
<words>
word_1
word_2
...
我遇到的问题是 XML 包含一个单词列表,我想以字符串列表的形式访问这些单词……而我似乎无法正确理解。到目前为止,这是我在代码方面的内容:
import sys
from xml.dom.minidom import parse
for file in sys.argv[1:]:
dom = parse( file )
title = dom.getElementsByTagName( 'job_ad' )[0].getAttribute( 'title' )
# This works
words = dom.getElementsByTagName( 'unigrams' )[0].childNodes[0]
# This is NOT a list of strings ...
我想迭代这段代码中的数据结构“单词”。我知道有更强大的 XML 模块可用......但现在我想用所示的模块来解决这个问题。
对此的任何帮助将不胜感激。
在此先感谢和亲切的问候-
拍