1

我有一些从wireshark 转换而来的非常大的xml 文件(> 50G)。当使用 iterparse 从这些文件中提取信息时,我发现有一些格式错误的数据包会导致 iterparse 报告错误,它说:

对于事件,上下文中的 elem:文件“iterparse.pxi”,第 207 行,在 lxml.etree.iterparse 中。下一个(src/lxml/lxml.etree.c:126122) lxml.etree.XMLSyntaxError: 属性 p 的规范要求值,第 285430929 行,第 50 列

我该怎么做才能跳过这些格式错误的数据包并继续解析?

4

0 回答 0