-3

我试图将 freebase rdf 导入到谷歌细化但得到一个错误....但是现在如何将具有显着类型的主题名称从 18 gb rdf 提取到 csv 等....任何 gui 工具?

4

1 回答 1

2

146 GB 对于 OpenRefine(前 Google Refine)来说太大了,无法处理。如果有开箱即用的 GUI 工具,我不熟悉,但由于这是一个编程问答网站,我将给出一个 shell 编程解决方案。你不需要知道任何关于 Linux 的知识,但你需要知道如何使用 Unix shell 命令(你可以在 Windows 上使用 Cygwin)。

 curl -L http://download.freebaseapps.com | gunzip | egrep 'notable_for|notable_type|rdfs:label'

将为您提供组装解决方案所需的所有原始数据。包含关键信息的行如下所示,但如果您只需要标签/名称,则需要将它们替换为第一列和最后一列中的主题/对象 ID。

ns:m.01nsxs2    ns:common.topic.notable_types   ns:m.0kpv17.
于 2013-07-05T14:31:08.183 回答