我有一个解析巨大 XML 的数据导入工具(它使用 SAX 解析器,但适应是我的最小问题)。发生故障、新部署、系统重启,我不想完全重新开始,所以我需要不时保存解析器状态(如果需要,我们可以将其称为 XML 游标)。
是否有任何解析器能够保存它们的状态并恢复它们(显然我必须在恢复时搜索文件)?
我还没有找到这样的解析器,所以我对此表示怀疑,所以这是我的第二个问题:您对我应该如何开始实施它有什么建议吗?采用 SAX 解析器实现并深入研究,还是从头开始会更好?
如果重要,我需要 xml 命名空间,但不需要模式/DTD 检查。
游标还可以用于预解析 xml 和分发工作以进行并行处理。