背景:
我有一个大型 OWL(Web 本体语言)文件(大约 125MB 或150 万行长),我想将其解析为一组制表符分隔的值。我一直在研究 SAX 和 DOM XML 解析器,发现以下内容:
- SAX 允许逐个节点读取文档,因此整个文档不在内存中。
- DOM 允许将整个文档一次放入内存中,但开销很大。
大文件的 SAX 与 DOM:
据我了解,
- 如果我使用SAX,我将不得不逐个节点地迭代 150 万行代码。
- 如果我使用DOM,我会有很大的开销,但是结果会很快返回。
问题:
我需要能够在相同长度的类似文件上多次使用此解析器。
因此,我应该使用哪个解析器?
加分项:有谁知道任何好的 JavaScript 解析器。我意识到很多都是为 Java 制作的,但我更喜欢 JavaScript。