我在 16gb 的文件系统空间上只有 200 万个 XML 文档。它们都是有效的并且共享一个 DTD。它们的大小大致相同(均由同一实验室信息系统生成)。
我正在为单个用户寻找一种简单的方法来查询整个 2M 文档语料库。我不希望将其暴露给网络甚至多个 LAN 用户;但是,我希望它能够向我的 Intranet 公开一些查询接口。我对查询语言很灵活,但我希望能够进行临时查询。我希望它至少具有类似性能,并且我愿意根据需要提供额外的磁盘空间来容纳索引。
一个可行的解决方案必须在具有 8gb RAM 的单个四核 Linux 机器上是可悲的,新硬件不是一个选项。
我找到了 e-Xist DB,但它似乎并没有太多的活动方式,并且演示站点已关闭。