3

我想使用 YAGO 3 rdf 三元组(来自http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/的 yago3_entire_ttl.7z )到使用 tdbloader 的 apache-jena Triplestore (3.1.0)。

apache-jena 提供的用于验证输入的 riot 工具给出了 2 种类型的错误(多次出现):

  1. 非法 unicode 转义序列值:\\ (0x5C)
  2. IRI 中的非法字符(代码点 0x7C,'|')

我明显的想法是替换 '\\' 和 '|' 接受通过防暴验证的字符序列,但我想知道是否有其他解决方案?

4

1 回答 1

0

在这里找到了解决方案:

现在 .ttl 文件需要进行某种预处理,其中非 unicode 字符被替换,以便 Jena 接受数据。在 Linux 上运行 sed -i 's/|/-/g' ./* && sed -i 's/\\/-/g' ./* && sed -i 's/–/-/g' ./ * 从您的 .ttl 文件所在的目录中。在 Windows 上,启动 Ubuntu Bash,导航到相应的目录(例如 /mnt/c/Users/Ferdinand/yago)并执行相同的命令。这将需要几分钟。我的意思是,真的有几个...

https://ferdinand-muetsch.de/how-to-load-yago-into-apache-jena-fuseki.html

于 2017-04-20T09:34:58.667 回答