1

我是 RDf 的新手,我正在寻找具有出色读取性能的开源 RDF 数据库。每秒将有大约 100 亿个三元组和 100 多个 SPARQL 查询。现在,我不需要同时读取和写入数据库。

我已经在维基百科(http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations)中看到了数据库,但我想要一些专家建议,哪些是经过最多时间测试的系统。它应该具有 Apache 许可证或同等许可的许可证。

4

1 回答 1

4

Jena 和 Sesame 可能是唯一符合您的许可标准的数据库,但它们都不会扩展到您需要的大小。使用 TDB 的 Jena可能会,但我不确定这种规模的性能会如何。Sesame Native 当然不是为这种规模而设计的。

还有其他开源数据库,但它们是 GPL 的,例如 4store,它可能符合您的性能标准。但最好的选择是使用商业数据库(大多数都有免费评估版);这是获得所需规模和读取吞吐量的最佳方式。但这意味着你可能不得不为某人的辛勤工作付钱,我知道。

于 2013-03-16T12:03:51.533 回答