我正在尝试使用 Python 从文档中删除 XML 标记,Python 是一种我是新手的语言。这是我第一次尝试使用正则表达式,whixh 确实是一个最好的想法。
mfile = file("somefile.xml","w")
for line in mfile:
re.sub('<./>',"",line) #trying to match elements between < and />
那惨遭失败。我想知道应该如何使用正则表达式。
其次,我用谷歌搜索发现:http ://code.activestate.com/recipes/440481-strips-xmlhtml-tags-from-string/
这似乎有效。但我想知道有没有更简单的方法来摆脱所有 xml 标签?也许使用元素树?