我正在构建一个应用程序,它显示有关给定文本实体的信息。我正在使用 Python 的 sparqlwrapper 库来查询 DBpedia。当我得到一个Person
实体时,我正在使用以下代码:
def get_person_data(einfo):
data = {}
try:
uri = einfo['disambiguated']['dbpedia']
sparql = SPARQLWrapper("http://dbpedia.org/sparql")
query = u"""
SELECT ?birthDate, ?birthName, ?birthPlace
WHERE { <%s>
dbpprop:birthDate ?birthDate ;
dbpprop:birthName ?birthName ;
dbpprop:birthPlace ?birthPlace
}
""" % uri
sparql.setQuery(query)
sparql.setReturnFormat(JSON)
results = sparql.query().convert()
此代码的问题在于,当 DBpedia 页面中缺少字段时,结果不会返回任何内容。很难知道给定类型的所有实体中都存在哪些属性,所以我想定义一些理想的属性,然后获取那些存在的属性。我尝试使用以下内容进行查询:
SELECT * WHERE {
?x rdfs:label "New York"@en.
?x dbpedia-owl:abstract ?abstract.
OPTIONAL {
?x dbpedia-owl:areaTotal ?areaTotal.
?x dbpprop:governor ?governor.
?x dbpprop:birthPlace ?birthPlace.
}
FILTER (LANG(?abstract) = 'en')
}
在这种情况下,纽约没有birthPlace
,所以我最终只获得了abstract
信息。我也areaTotal
想得到governor
。