我想通过其主要级别条目的 ID 索引 XML 文件。我计划解析整个文档,从条目中提取 ID 并将其编入索引(记住开始标签的文件位置<
和结束标签的位置>
+ 1)。稍后这将允许我通过 ID 快速找到这个地方。
但是是否可以使用 SAX 跟踪文件位置?
如果 SAX 无法实现,那么是否还有其他解析器能够做到这一点?
更新
我发现Location有getCharacterOffset()
方法。是StAX
吗?
更新 2
Location
工作,但不知何故出乎意料。第一个标签是mediawiki
,它从零位置开始。getCharacterOffset()
从处理的最开始同时返回 4。
似乎发生了一些预读。