我有一个 XML 文档,它处于 FO 转换前或转换后的状态,我需要从中提取一些信息。在前例中,我需要提取两个代表 pageWidth 和 pageHeight 的标签,在后例中,我需要从特定标签中提取 page-height 和 page-width 参数(我忘记了它不在我的头顶)。
我正在寻找的是一种有效/易于维护的方式来获取这两个元素。我只想一次阅读文档以获取我需要的两件事。
我最初开始写一些会使用BufferedReader
+的东西FileReader
,但后来我正在做字符串搜索,当标签跨越多行时它会变得混乱。然后我查看了DOMParser
,这似乎是理想的,但如果我可以帮助它,我不想将整个文件读入内存,因为文件可能很大,我正在寻找的标签会几乎总是靠近文件的顶部。然后我调查了SAXParser
,但这对于我想要完成的事情来说似乎是一大堆复杂的矫枉过正。
有人有什么建议吗?或者可以实现我的目标的简单实现?谢谢。
编辑:我忘了提到,由于我有各种限制,我使用的任何东西都必须“内置”到核心 Java 中,在其中我不能使用和/或下载任何第 3 方 XML 工具。