语义网在信息检索中的用途是什么。语义网在这里我的意思是,像 DBPedia、Freebase 这样的结构化创建。
2 回答
我已经在几个项目中将 RDF 中的信息与 Lucene 集成在一起,我认为您可以从集成中获得的很多价值是您可以超越 Lucene 通常启用的简单关键字搜索。这为对您的 RDF 信息进行全文搜索提供了可能性,同时也提供了语义丰富的全文搜索。
在前一种情况下,SPARQL 中没有“like”运算符,并且 regex 函数虽然与 SQL like 具有类似的能力,但对于任何可观大小的数据集进行评估都不是很容易处理。但是,如果您能够使用 lucene 进行搜索而不是依赖正则表达式,则可以通过 RDF 上的单个关键字搜索获得更好的规模和性能。
在后一种情况下,如果查询引擎与 lucene text/rdf 索引集成,想想LARQ(Jena和Stardog都支持这一点),您可以对全文索引进行更复杂的语义搜索。诸如“获取至少有 10 条评论并且评论包含“两个竖起大拇指”的短语的所有类型的电影”之类的查询很难用 lucene 索引来摆动,但在 Lucene 和 SPARQL 的交叉点中变得非常微不足道。
您可以在信息检索中使用 DBpedia,因为它具有来自 Wikipedia 的结构化信息。由于维基百科几乎了解所有感兴趣的主题,包括文章、类别、信息框,这些知识在信息检索系统中用于以三元组的形式提取有意义的信息,即主语、谓语和宾语。
您可以使用以下端点通过 SPARQL 查询信息:Endpoint to query the information from DBpedia