0

我在具有 32gb 内存的 Windows 服务器上设置了 graphdb。我修改了 loadrdf cmd 并添加了“-Xms16G -Xmx24G”。

不,我正在尝试导入整个 Wikidata rdf-dump,但遇到了困难。首先,我尝试使用 10.000.000 的实体索引大小值,它工作正常,直到 loadrdf 工具在达到 10 亿多三倍后中止。然后我尝试将 entity-index-size 值设置为 2.000.000.000,但效果更差。目前它已经处理了 500.000.000 个三元组,但加载速度已降至 7.000 st/s。

是否有任何其他我应该注意的设置/配置可以使导入工作?

4

1 回答 1

1

公开的 Wikidata RDF 转储有大约 20 亿条语句和大约 5 亿个独特的 RDF 资源。默认情况下,实体池结构(所有唯一 RDF 资源的索引)存储在堆外内存空间中,您至少需要预留 8GB。为操作系统系统增加至少 3GB,这意味着您实际上需要将使用的内存量减少到“-Xmx20G”。

为了加快数据加载速度,GraphDB 文档建议使用 SSD。这将提高数据加载速度,因为 SSD 的寻道时间要短得多。

于 2017-06-15T11:15:01.000 回答