我想通过其主要级别条目的 ID 索引 XML 文件。我计划解析整个文档,从条目中提取 ID 并将其编入索引(记住开始标签的文件位置<和结束标签的位置>+ 1)。稍后这将允许我通过 ID 快速找到这个地方。
但是是否可以使用 SAX 跟踪文件位置?
如果 SAX 无法实现,那么是否还有其他解析器能够做到这一点?
更新
我发现Location有getCharacterOffset()方法。是StAX吗?
更新 2
Location工作,但不知何故出乎意料。第一个标签是mediawiki,它从零位置开始。getCharacterOffset()从处理的最开始同时返回 4。
似乎发生了一些预读。