我需要类似于 GKG 的数据,主要用于命名实体识别。基本上我想使用实体背后的上下文(额外信息)进行实体识别。建议的数据使用方式是什么?
我发现 DBPedia 提供了所需的内容,但我觉得数据不完整。对于像“Larry_Page”这样的实体,在 3.8 版本的 instance_types 转储中,内容似乎是
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.w3.org/2002/07/owl#Thing> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Agent> .
因此,对于“Larry_Page”,信息仅限于“Person”类型。有什么方法可以让我获得完整的实体层次结构及其类型?