我的应用程序使用来自不同供应商的 XML 数据。所有供应商都有不同的 xml 格式/模式,并且需要自定义查询来从这些 XML 中检索各种数据。
我最初从 RDBMS 方法开始,在从供应商处检索特定 XML 之后,我将解析/查询 XML 并将数据写入一些表中。(使用 Woodstock StAX 解析器)。然而,由于 RDBMS(固定模式)的本质,我无法支持来自不同供应商的所有 XML 格式,即使我支持,我也必须将分层 xml “规范化”为 RDBMS 固定模式关系数据。
来自供应商的 xml/数据每天都会频繁更新,大小从几 kb 到 50 MB 的数据文件不等。
我正在评估各种 NXD(原生 Xml 数据库)、eXist-db、Sedna、BaseX 和 MonetDB 作为下一步,看看这是否适合我的目的。
有人可以就如何解决这个问题提供一些实用的建议吗?或者已经构建了类似的系统,可以处理大量不同格式/模式的 XML 数据。
以下是我试图回答的核心 XML 要求:
- 处理来自多个来源的多个 xml 数据文件。XML 因供应商而异。
- XML 更新,整个文档以及数据库中现有 XML 中的一些字段。
- 确定其是否来自特定供应商并相应地触发查询。
- 使用 XPath/XQuery 查询这些 xml 以读取数据以将其以通用视图呈现给用户。
请指教。
谢谢,苏布罗。