rdf - 哪种 SPARQL 实现（三重存储）最适合读取性能？

Question

我是 RDf 的新手，我正在寻找具有出色读取性能的开源 RDF 数据库。每秒将有大约 100 亿个三元组和 100 多个 SPARQL 查询。现在，我不需要同时读取和写入数据库。

我已经在维基百科（http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations）中看到了数据库，但我想要一些专家建议，哪些是经过最多时间测试的系统。它应该具有 Apache 许可证或同等许可的许可证。

score 4 · Accepted Answer

Jena 和 Sesame 可能是唯一符合您的许可标准的数据库，但它们都不会扩展到您需要的大小。使用 TDB 的 Jena可能会，但我不确定这种规模的性能会如何。Sesame Native 当然不是为这种规模而设计的。

还有其他开源数据库，但它们是 GPL 的，例如 4store，它可能符合您的性能标准。但最好的选择是使用商业数据库（大多数都有免费评估版）；这是获得所需规模和读取吞吐量的最佳方式。但这意味着你可能不得不为某人的辛勤工作付钱，我知道。

1 回答 1