我是第一次使用 WikiData 和 RDF。我下载了 WikiData 24GB “真实”数据集(仅提供 N-Triples.nt
格式),但现在我很难理解它。
以下是与Jack Bauer显示(主语、谓语、宾语)三元组.nt
相关的文件中的一些行:
<http://www.wikidata.org/entity/Q24> <http://schema.org/description> "protagonista della serie televisiva americana ''24''"@it .
<http://www.wikidata.org/entity/Q24> <http://schema.org/name> "Jack Bauer"@en .
<http://www.wikidata.org/entity/Q24> <http://www.wikidata.org/prop/direct/P27> <http://www.wikidata.org/entity/Q30> .
<http://www.wikidata.org/entity/Q24> <http://www.wikidata.org/prop/direct/P451> <http://www.wikidata.org/entity/Q284262> .
所以我的问题是:
- 三元组的所有 URI 是否都可以从这个巨大的文件中解析为英文,还是我必须进行 API 调用?例如,我想解决这个三元组:
<http://www.wikidata.org/entity/Q24> <http://www.wikidata.org/prop/direct/P27> <http://www.wikidata.org/entity/Q30> .
变成这样的英语人类可读形式:
Jack Bauer, country of citizenship, United States of America
Q24
此文件是否包含获取、P27
和的英文可读名称所需的信息Q30
?还是我必须进行单独的 HTTP API 调用来解决它们?
- 我也可以得到
.json
这个文件的转储。我的理解是否正确,.nt
三元组只是对 JSON 层次结构的深度优先遍历,以将所有数据扁平化为三元组?