我有一个巨大的 xml 文件,其格式为
<XML>
<Application id="1" attr1="some value" attr2="some val"..and many more attr also with nested tags inside application which might contain more attributes
</Application>
<Application id="2"attr1="some value" attr2="some val"..and many more attralso with nested tags inside application which might contain more attributes
</Application>
<Application id="3"attr1="some value" attr2="some val"..and many more attr also with nested tags inside application which might contain more attributes
</Application>
.... probably 10000 more Application entries
</XML>
每个应用程序标签只有属性没有内容,但还包含可以有属性的嵌套标签,我需要解析和提取一些属性。我正在使用以下脚本,它在应用程序标记的一小部分上运行良好,但是当记录变高时会变得非常慢,不幸的是,当我在完整文件上运行它时,它给了我一个分段错误核心转储,甚至一半文件。
这是我的脚本任何关于如何更好地做到这一点的建议将不胜感激。