我需要的只是获取相应标签的文本并将其保存到数据库中。由于 xml 文件很大(4.5GB),我使用的是 sax。我使用字符方法来获取文本并将其放入字典中。但是,当我在endElement方法中打印文本时,我得到的是新行而不是文本。
这是我的代码:
def characters(self,content):
text = unescape(content))
self.map[self.tag]=text
def startElement(self, name, attrs):
self.tag = name
def endElement (self, name)
if (name=="sometag")
print self.map[name]
提前致谢。