2

我有一个解析巨大 XML 的数据导入工具(它使用 SAX 解析器,但适应是我的最小问题)。发生故障、新部署、系统重启,我不想完全重新开始,所以我需要不时保存解析器状态(如果需要,我们可以将其称为 XML 游标)。

是否有任何解析器能够保存它们的状态并恢复它们(显然我必须在恢复时搜索文件)?

我还没有找到这样的解析器,所以我对此表示怀疑,所以这是我的第二个问题:您对我应该如何开始实施它有什么建议吗?采用 SAX 解析器实现并深入研究,还是从头开始会更好?

如果重要,我需要 xml 命名空间,但不需要模式/DTD 检查。

游标还可以用于预解析 xml 和分发工作以进行并行处理。

4

1 回答 1

0

真的取决于内容,你能不能写一个 XQuery 来明确地在文件中找到一个节点。

例如<Item id="1000"/>

如果是这样,在成功解析节点后将其持久化,那么当您恢复时将其传入(null 等于从第一个开始)。然后移动到目标节点,移动到下一个,然后在 y va 上。

于 2012-05-25T15:40:13.183 回答