我想使用 lucene 和 jena 对 dbpedia 的子集(我在 tdb 商店中有)执行全文搜索。
String TDBDirectory = "path" ;
Dataset dataset = TDBFactory.createDataset(TDBDirectory) ;
但不是所有资源,只是标题。我认为通过仅在所需的三元组上创建索引,我可以执行更快的搜索。例如
<http://de.dbpedia.org/resource/Gurke> <http://www.w3.org/2000/01/rdf-schema#label> "Gurke"@de .
在这里,我想搜索“Gurke”,但除了具有#label 属性的三元组之外,不搜索任何其他三元组。所以我的问题是如何使用#label 属性构建索引并仅搜索三元组?我已经看过http://jena.sourceforge.net/ARQ/lucene-arq.html但它不够详细或对我来说太难了。