3

我正在尝试基于 Sesame 创建一个 SPARQL 端点。我安装了 Tomcat、PostgreSQL,并部署了 Sesame 的 Web 应用程序。我创建了一个基于 PostgreSQL RDF 存储的存储库。现在我需要将一个大的 ttl 文件(540M 三元组,文件大小为几 GB)加载到存储库中。通过 Workbench 加载大文件不是一个好的解决方案 - 这需要几天时间。加载数据的最佳非编程解决方案是什么?是否有像“控制台”这样的工具来加载数据?例如,Virtuoso 有用于批量加载的 isql 工具...

4

1 回答 1

1

据我所知,没有现成的可用于 Sesame 的批量加载工具 - 尽管 Sesame 兼容的 Triplestore 供应商确实将此类工具作为其特定数据库的一部分提供。编写批量上传解决方案并不是特别难,但不知何故,我们从未想过在 Sesame 核心发行版中包含这样的工具。

顺便说一句,540M 三元组对于 Sesame 的任何默认存储来说可能都太大了——Native Store 只能扩展到大约 150M,并且将如此大的数据集加载到内存存储中太笨拙了(即使你有可用的 RAM) . 因此,您可能需要考虑使用第三方提供的 Sesame 兼容数据库。有许多可用的选择,包括商业的和免费的/开源的,请参阅Sesame 网站上的此概述以获取一些建议列表。

于 2014-11-26T20:34:13.890 回答