是否可以通过应用一些过滤器来获取 Freebase 的主题?
Freebase 现在包含大约 2800 万个主题。
我想获取所有主题名称,例如记录名称(约 700 万个主题)。
是否可以?
是否可以通过应用一些过滤器来获取 Freebase 的主题?
Freebase 现在包含大约 2800 万个主题。
我想获取所有主题名称,例如记录名称(约 700 万个主题)。
是否可以?
当然。您可以通过 API 轻松完成此操作,但对于您想要的主题数量,您最好使用数据转储。
获取这个 1.4 GB 的文件:http: //download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2
并使用命令
bzegrep -v $'/music/recording[\t,]' freebase-simple-topic-dump.tsv.bz2 | cut -f 2 > names.txt
几分钟后,您将拥有 2100 万个名字。