0

我需要类似于 GKG 的数据,主要用于命名实体识别。基本上我想使用实体背后的上下文(额外信息)进行实体识别。建议的数据使用方式是什么?

我发现 DBPedia 提供了所需的内容,但我觉得数据不完整。对于像“Larry_Page”这样的实体,在 3.8 版本的 instance_types 转储中,内容似乎是

    <http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.w3.org/2002/07/owl#Thing> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Agent> .

因此,对于“Larry_Page”,信息仅限于“Person”类型。有什么方法可以让我获得完整的实体层次结构及其类型?

4

1 回答 1

0

你试过 Freebase 吗?在 Freebase 中,他们为 Larry Page 提供了一个 /common/topic/notable_for Computer Scientist。这些数据库的问题是您必须做很多工程(魔术)才能选择正确的谓词。而且你总是有一些噪音。

PS 很抱歉发布回复,我没有足够的声誉来添加评论:)

于 2013-08-27T07:48:11.310 回答