最新版本的 TDB 有两个用于批量加载的命令行实用程序:tdbloader 和 tdbloader2。第一个是纯 Java,它可以在 Windows 以及任何带有 JVM 的机器上运行。第二种是 Java 和 UNIX shell 脚本的混合(特别是它使用 UNIX 排序)。它在 Linux 上运行,我不确定它在 Cygwin 上运行。我建议你在 64 位机器上使用 tdbloader,尽可能多的 RAM。:-)
最新版本的 TDB 可在此处获得:http:
//www.apache.org/dist/incubator/jena/jena-tdb-0.9.0-incubating/jena-tdb-0.9.0-incubating-distribution.zip
TDB 的开发版本有一个额外的批量加载器命令:tdbloader3。这是 tdbloader2 的纯 Java 版本。我们没有使用 UNIX 排序(仅适用于文本文件),而是对二进制文件使用纯 Java 外部排序。有关 tdbloader3 的更多详细信息,请搜索 JENA-117 问题。
您可以在 Apache 快照存储库中找到 TDB 的 SNAPSHOT,警告您尚未发布。
对于更喜欢冒险的人来说,还有 tdbloader4,它不包含在 Apache Jena 中,它被认为是一个实验原型。tdbloader4 使用 MapReduce 构建 TDB 索引(即 B+Tree 索引)(这稍微扩展了 MapReduce 模型,但它可以工作)。你可以在这里找到 tdbloader4:https ://github.com/castagna/tdbloader4
最后,在 Windows 上,我对您的建议是:下载最新的 TDB 官方版本,并在具有大量 RAM 的 64 位机器上使用 tdbloader。如果您没有,请使用 m1.xlarge EC2 实例(即 15 GB 的 RAM)(或等价物)。
如需更多帮助,我邀请您加入官方的 jena-users@incubator.apache.org 邮件列表,我相信您将获得更好更快的支持。