问题标签 [morelikethis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr MoreLikeThis:我可以给 Solr 5 个文档 ID 并获得更多像这 5 个这样的文档吗?
从文档中我不清楚这一点。是否可以提供 Solr X 文档 ID 并告诉它我想要类似的文档?
例子:
- 用户正在浏览 5 篇不同的文章
- 我将这 5 篇文章的 ID 发送给 Solr,以便向用户展示其他类似的文章
我不清楚是否发送文档 ID,也不清楚 MoreLikeThis 是否可以像本示例中那样对多个文档进行操作。
solr - Solr MoreLikeThis 和使用 Boost 函数(Boost 最近的项目)
我有一个类似的问题,如“在 MoreLikeThis Solr 请求处理程序中提升最近的项目”在 MoreLikeThis Solr 请求处理程序中提升最近的项目
我想提升从 MoreLikeThis 处理程序或组件返回的最近项目。我发现 MoreLikeThisHandler 不支持 bf ,因为它是 Dismax 参数。
因此我尝试了以下(在我的 solrconfig.xml 中):
和
apache - 如何在 Solr 上使用 MoreLikeThis 功能来查找与文本文件相似的文档?
我正在尝试使用 solr 执行以下操作:
从 txt 文件中读取一些文本,然后在文本上使用 MoreLikeThis 来查找与该文本相似的文档。我怎样才能用 Solr 做到这一点?
据我所知,我认为我必须使用内容流,但我不知道如何配置它......
solr - Solr MLT:获取具有相似关键字的所有记录
我有一个包含我想要的所有可搜索文本的字段,其中包含记录的关键字,如下所示:
但是每当我尝试通过该字段获取类似记录(MLT)时,返回的结果为零。我错过了什么吗?Solr 在寻找什么?
更新:
文本类型分析器:
solr - 更像 Solr 查询过滤
我试图使用 SOLR 的 MLT(更像这样)功能,但被困在如何使用相关内容的过滤上。例如,我在 solr 中的文档有以下不同的类别:体育、娱乐、搞笑、商务等
我想要每个类别的相关内容(基于用户查询)。因此,我想过滤类别类型的 solr 的 MLT 结果。我可以以某种方式过滤结果吗?
如果不可能,我能否以某种方式使用 solr 函数查询来确保相关内容按类别分组?
谢谢。
solr - Solr MoreLikeThisComponent:返回结果文档的相似度值
我使用 MoreLikeThisComponent 执行 SOLR 搜索并返回相关文档(通过 URL 传递 mlt=true 和相关参数)。如何获得相似文档的相似度值?
solr - Solr 更像这样在指定“mlt.count”时不返回分数
我正在使用 solr 来分析最相似的文档。但是,当我指定mlt.count
参数并且如果它不是 15 时,分数不会显示。更像这个论点的是mlt=true&mlt.fl=text&mlt.count=12
,而text
是具有术语向量的字段。fl
论据是*,score
。我查询了这个网址:
http://localhost:8983/solr/collection1/select?q=id%3A1967956383&wt=json&indent=true&mlt=true&mlt.fl=text&mlt.count=12
.
当我指定mlt.count=15
时,分数就会出现。之后,我mlt.count=12
再次查询,它也出现了。
我的 solr 版本是 4.0。
有人知道吗?谢谢!
django - haystack more_like_this 返回不同类的对象
Article
我希望在调用时获得对象列表SearchQuerySet().more_like_this(an_article)
但是,它也返回其他类的对象。
我可能会在这里错过什么?
lucene - 如何在 Lucene 中对类似的文档进行评分?
我想在 Lucene 中对类似的文档进行评分。让我解释一下我的情况。
例如,假设我在创建索引的文件中有以下记录。
当我搜索“John Doe”时
我创建的搜索索引将按以下顺序显示记录
如您所见,Lucene 根据我搜索的术语显示记录,而不是根据记录之间的相似性。我希望它使用提供的术语搜索记录,但根据它们的相似性显示它们。
我想要的是
在这里,John Twain 和 John Doe 记录一起显示,因为它们都很相似,并且其中一个在用户查询中具有最大匹配项。
你找我吗?
搜索代码。
尝试的方法:
我试图使用 MoreLikeThis 类,但不确定我是否做得对,或者即使它是正确的方法。此外,我将如何对两个或多个 docid 使用 Like 方法?另外,如果使用 docid,它将显示重复的文档,因为我正在从同一个阅读器中阅读
代码:
请让我知道,如果你有任何问题。
我正在尝试从过去两周学习 Lucene,所以不太了解。
注意:我使用的是 Lucene.Net 3.0.3
lucene - 空查询 - 更像这样 (Lucene)
我是 Java 和 Lucene 的新手。我正在尝试一个简单的 MLT 测试,但我没有得到任何结果。
这就是我得到的:
阅读器上有 4 个文档。
找到 0 次点击。
我尝试使用 Luke 来检查 Doc 的 ID,显然没有任何问题。
我什至在那里做了一些测试,我不知道出了什么问题:(
在网上做了很多搜索,有人说了一些关于 MinTermFreq 和 MinDocFreq 的设置,我尝试了 1 和 0,但什么也没得到。
有人有想法吗?
提前致谢!
[已解决] 编辑:
它现在工作!
我只需要添加这个: