1

Freebase称,他们有 23,407,174 个主题。获取所有这些主题的 UI 友好名称(本质上是主题 JSON 的“文本”属性,单个主题 JSON 的示例在这里)的最简单方法是什么?我不需要任何其他元信息。

4

2 回答 2

1
wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 2 > freebase-topic-names.txt

尽管您可能还需要 Freebase ID,以便知道名称指的是什么:

wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 1,2

需要额外的两个后处理位:

  1. 制表符转义为 \t
  2. 字符串 \N 表示一个空(不存在的)名称
于 2012-07-12T16:08:11.627 回答
0

看看我们提供的简单主题转储。它有超过 GB 的压缩数据,但下载起来比尝试通过 API 获取所有名称要快。

于 2012-07-11T23:37:06.380 回答