26

What's currently the best choice to persist graph-like structures? Graph databases (e.g. Neo4j) or RDF triple stores (e.g. Virtuoso)?

For example, we have the following use case:

  • the weakly connected graph (similar to the one of scholarly papers in a collection) with nearly 10M nodes;
  • quite rare updates;
  • critical operations: retrieving particular sub-graphs, updating nodes in a given sub-graph, re-computing link analysis measures (e.g. HITS or PageRank) after updating some nodes.

Providing the standard API to query the data for third party applications (a la Facebook's or Twitter's) is desired as well.

4

2 回答 2

11

使用 Virtuoso,您可以享受以下工作:

-- SPARQL、SQL、SPASQL(SQL 中的 SPARQL)和 SPARQL 中的 SQL 支持(例如,用于通过魔术/函数谓词/属性处理 N 元关系。

-- 用作紧凑型引擎(例如,通过 KDE 桌面利用)或大型 DBMS,如通过实时 170 亿三倍+ LOD 云缓存或较小的 DBpedia 实时实例所展示的。

-- 包括 SPARQL 中的全文索引和文本模式(通过 bif:contains)它还包括 XPath/Xquery(通过 xcontains)

-- 在处理属性图存储时,Acid 或 Non Acid 模式同上 Schema-Last

-- 通过转换中间件,它可以从 80 多个数据源(包括 REST API、SOAP 服务、超媒体资源、ODBC 或 JDBC 可访问的关系数据源等)中提取数据并转换为瞬态或持久链接数据图

-- 关联数据发布是自动的,即发布 DBMS 记录创建后,您有内置的关联数据页面,作为 DBMS 的视图。没有搞乱重新。URL 重写规则、303 重定向或类似的东西。InterWeb 规模的超级密钥可以正常工作!

现在就是这样:-)

于 2011-02-11T22:11:12.490 回答
8

对于水平规模(因此是中小型数据库),neo4j 等图形数据库目前将为图形遍历提供更好的性能。Triplestores正在迎头赶上。与图形数据库相比,Triple Store 的一大优势在于数据转储和查询语言是标准化的,这意味着它更容易迁移到另一个产品并防止供应商锁定。

于 2011-03-09T10:00:21.007 回答