1

是否可以通过应用一些过滤器来获取 Freebase 的主题?

Freebase 现在包含大约 2800 万个主题。

我想获取所有主题名称,例如记录名称(约 700 万个主题)。

是否可以?

4

1 回答 1

1

当然。您可以通过 API 轻松完成此操作,但对于您想要的主题数量,您最好使用数据转储。

获取这个 1.4 GB 的文件:http: //download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2

并使用命令

bzegrep -v $'/music/recording[\t,]' freebase-simple-topic-dump.tsv.bz2 | cut -f 2 > names.txt

几分钟后,您将拥有 2100 万个名字。

于 2012-12-18T21:11:46.330 回答