3

是否有任何可以处理大型 RDF 数据集(3.2 亿)和 SPARQL 查询的企业级数据库引擎(Oracle、MS SQL...等)?我想我的问题也是:SPARQL/RDF/OWL 是否准备好为企业提供大型现实世界数据仓库?如果没有,是否有针对典型数据仓库星型模式调整 SPARQL/RDF 的有效机制。

谢谢!

4

6 回答 6

3

Virtuoso - 是Bio2RDFDBPedia使用的数据存储

于 2009-11-05T07:18:46.967 回答
1

根据 Kaarel 的建议,今年在 ISWC 上展示的参赛作品之一使用了 4store,尽管竞争对手将其设置为一些奇怪的配置,但 Gralik(开发 4store)的 CTO 向我和同事描述为“疯狂”但4store 将能够达到这种规模 - http://4store.org

Virtuoso 还支持这种规模的存储,它们有一个实时应用程序,您可以使用该应用程序对大多数主要 LOD(链接开放数据)数据源进行 SPARQL 查询,总计约 90 亿个三元组

Virtuoso - http://virtuoso.openlinksw.com
LOD 应用程序 - http://lod.openlinksw.com/sparql

于 2009-11-05T00:32:41.657 回答
1

我在 W3C wiki 上维护了这个大型三元存储列表:http:
//esw.w3.org/topic/LargeTripleStores

众所周知,有 7 家三联店能够容纳超过 10 亿个三联店。其中四个是开源的。如果您有更多信息,请更新上述 wiki 页面。

显然,性能取决于您使用它的目的。我在一个大型工业项目中使用了 Virtuoso,速度相当快。

于 2009-12-21T08:21:27.310 回答
1

Neo4j开箱即用地处理大约 1+ 十亿个三元组,SAIL API在这里,同时仍然有整个图可以用Gremlin或 SPARQL之类的东西做高级的东西。

免责声明:我是 Neo4j 团队的一员。

于 2009-12-21T18:11:50.927 回答
0

Intellidimension提供了一个名为Semantic Server的解决方案,该解决方案是在 Microsoft 的 SQL Server 2005 或 2008 之上开发的。它可以轻松扩展到数亿个三元组,而且我知道他们至少有一个客户愉快地运行着超过十亿条语句的企业部署。

我是他们使用超过 1 亿个数据集的客户之一。我们的计划是朝着数十亿的声明迈进。

于 2009-11-05T02:00:55.503 回答
0

4store 看起来是一个很好的解决方案,但是此时文档非常稀少,当我上次查看它时,无法从图表中删除单个三元组。

我也会看看BigData

这是他们主页上的引述,总结了他们的产品。

Bigdata(R) 是一种开源横向扩展存储和计算结构,支持可选事务、非常高的并发性和非常高的聚合 IO 速率。Bigdata 从一开始就被设计为一种分布式数据库架构,针对在 100 到 1000 台机器的集群上运行的非常高的聚合 IO 速率进行了优化,但也可以在单服务器模式下运行。Bigdata 提供了一个分布式文件系统,类似于 Google 文件系统,但也可用于工作流队列、数据可扩展稀疏行存储,类似于 Google 广泛认可的 bigtable 项目,以及用于在集群上并行化数据密集型工作流的 map/reduce 处理。

Bigdata(R) 附带一个非常高性能的 RDF 存储,支持 RDF(S) 和 OWL Lite 推理。Bigdata RDF 存储是目前唯一能够在具有动态键范围索引分区的集群上运行的 RDF 数据库。Bigdata RDF 存储专为满足超大规模语义对齐和联合的要求而设计。RDF 是一种语义 Web 技术,特别适合对图形形状的数据和元数据进行建模,例如关联实体链接模型,其中参与者在不断发展的概念本体的上下文中以特别的方式相互链接用于与特定问题域相关的实体类型和链接类型。Bigdata RDF 存储在数据收集系统中用于操作,以创建结构化、半结构化、

于 2009-11-06T19:58:53.263 回答