1

我想扩展 DBpedia 的映射数据库。因此,我想在我的计算机上运行我自己的提取框架实例。尽管后者只是简单地完成了,但我无法弄清楚如何为框架提供新创建的映射。

到目前为止我发现了什么:

  • 在“config.properties”中,我可以定义自己的转储文件夹。
  • 也可以定义一些输出目录。但是那里究竟存储了什么?
  • 在“Configuration.scala”中定义了映射页面的 url。这是否意味着框架需要一个网页作为输入,然后搜索映射?

我的目标是在纯文本文件中定义一些映射,然后以某种方式告诉提取框架将此文件用作所有映射的源。如果一切顺利,我将把我的成果贡献给 dbpedia 团队。

谢谢你的帮助!

4

1 回答 1

0
  • 也可以定义一些输出目录。但是那里究竟存储了什么?

提取框架输出所有提取数据的 N-Triples 和 N-Quads,基于映射和其他(另请参见http://dbpedia.org/Downloads上的文件)。

  • 在“Configuration.scala”中定义了映射页面的 url。这是否意味着框架需要一个网页作为输入,然后搜索映射?

映射从http://mappings.dbpedia.org/加载,这是一个用于创建和编辑映射的 wiki。您可以在那里获得帐户和编辑权限并编写自己的映射。然后在您运行提取框架时加载它们(并且使用映射的数据将在下一个版本中可用)。

我的目标是在纯文本文件中定义一些映射,然后以某种方式告诉提取框架将此文件用作所有映射的源。如果一切顺利,我将把我的成果贡献给 dbpedia 团队。

您可以继续让框架从本地文本文件中读取映射的 wiki 代码,但我认为直接在 wiki 上编辑它们会更好。您的贡献将立即可用。

于 2011-06-09T11:44:56.197 回答