1

是否可以配置 Solr 以使文档相似度得分在例如从 0(不匹配)到 1(完整文档和查询匹配)的范围内。

谢谢!

4

4 回答 4

0

不,我不是真的在谈论布尔查询,但感谢您提供有关 Lucene Similarity & Scoring 的资源。

好吧,我正在考虑用于信息检索的语言模型,想知道是否有人知道在 lucene/solr 中是否有此实现

http://nlp.stanford.edu/IR-book/html/htmledition/language-models-for-information-retrieval-1.html

于 2011-01-21T15:37:59.617 回答
0

你需要这个用于某种 UI 仪表吗?也许您应该查看文档之间的余弦相似度http://en.wikipedia.org/wiki/Cosine_similarity,其中第一个文档是查询。

于 2011-01-18T23:25:54.003 回答
0

不,tf-idf 不是那样工作的,从概念上讲,搜索也不是那样工作的。如何定义“完全匹配”?

于 2010-05-30T14:57:42.890 回答
0

应该有可能,你需要改变lucene排名功能(solr内部使用lucene)。您可以替换默认实现。我不知道你需要多少时间让它运行,但是——如果你真的需要一个布尔检索引擎——你可以做到。你应该从这份文件开始你的调查。

我不确定你需要什么这样的功能,但我想也许你想使用 Solr 作为键值存储。在这种情况下,您需要更改索引配置 - 您的分析器不应标记输入文本。如果是这样,文本将被放置在索引中而无需修改(相同的分析器用于处理查询)。因此,如果您在查询中提供一个键(字段“MY_KEY”的“1234”),您将获得该键的相应文档。

于 2011-01-19T21:26:54.243 回答