问题标签 [morelikethis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
174 浏览

lucene - 在 RavenDB 中聚合 MoreLikeThis 结果

我一直在尝试使用 MoreLikeThis Bundle 来带回一组文档,这些文档按与关键文档相比的“backyardigans”字段中的匹配数排序。这一切都按预期工作。

但我想做的是按加在一起的 3 个单独字段的匹配数排序。

一个示例记录是:

如果另一个文件匹配 1 个后院 2 个引擎和 1 头猪,它会得到 4 分

如果另一个文件匹配 2 个后院 4 个引擎和 0 头猪,它会得到 6 分

这些汇总的分数将是我们对结果进行排序的字段,因此它们会返回 6,4,依此类推。

请问有没有办法通过 MoreLikeThis 捆绑包实现这一点?

0 投票
1 回答
616 浏览

solr - Solr MoreLikeThis 查询匹配换行符

我有一个 Solr MoreLikeThis 查询,它产生了一些完全不相关的结果。当我查看查询的调试时,我可以看到查询匹配换行符。

这是查询:

mlt?q=is_lesson_id:49029&start=0&rows=3&fl=*,score&wt=json&fq={!tag=sites}sm_sitename:(FCM OR BCM OR CCM)&mlt.interestingTerms=details&mlt.match.include=false&mlt.match.offset=0&mlt .fl=title, body&mlt.mintf=2&mlt.mindf=1&mlt.minwl=4&mlt.boost=true&mlt.qf=title^1000 body&indent=on&debugQuery=on

下面是解释:

这是否表明服务器上的配置错误,或者内容索引不正确,或者是否需要更改查询?

0 投票
2 回答
1885 浏览

solr - 提升日期较新的项目的正确方法是什么?

我有一个更像这个查询的查询,我想先更新它以返回较新的文档。根据文档,我需要添加recip(ms(NOW,mydatefield),3.16e-11,1,1)到我的查询中。

但是当我尝试将它添加到 mlt.qf 或 bf 参数中时。结果保持完全相同。

这是我的查询:

/solr/mlt?

q=id:cms.article.137861

&defType=edismax

&rows=3

&缩进=打开

&mlt.fl=series_id,标签,标题,文本

&mlt.qf=show_id 文本^1.1 标题^1.1 标签^90

&wt=json

&fl=url,标题,标签,django_id,content_type_id

&bf=recip(ms(NOW,pub_date),3.16e-11,1,1)

0 投票
1 回答
83 浏览

grails - 限制 serachableService.moreLikeThis 在 grails 中返回的结果?

任何人都知道如何限制 moreLikeThis 方法返回 searchableService.moreLikeThis() 的结果

我想将结果域结果限制为可见性:公共可见性是域的属性并且可以是私有和公共的?

提前致谢, 米卡

0 投票
1 回答
1355 浏览

solr - Solr More Like This (MLT) 使用与默认 ID 不同的唯一标识符

我正在尝试使用 MLT,但我有唯一标识符 doc_id 而不是 id 如果我这样做:

http://localhost:8983/solr/mlt/?q=doc_id:question#11我没有结果

如果我这样做 http://localhost:8983/solr/mlt/?q=id:11我有结果

如何使用 MLT 和 doc_id 作为我的唯一标识符?

0 投票
2 回答
347 浏览

drupal - 有没有提供“更像这样”的模块?

我正在寻找一个模块(或一种方式),它可以在不使用 apache solr 模块的情况下在 drupal 中提供“更像这样”的块。

0 投票
1 回答
205 浏览

indexing - 在 RavenDB 中创建更多这样的

我的域中有这些文件:

我有这种情况:

  • 文章A1有关键字K1
  • 文章A2有关键字K1
  • 一位用户阅读文章A1
  • 我想建议用户阅读文章A2

我知道我可以使用More Like Thisbundle 并且我阅读了文档,但我不知道该怎么做?你能帮我吗?

0 投票
1 回答
399 浏览

java - 为什么要将Lucene的MoreLikeThis it's TermQueries限制在docFreq最高的字段?

我目前正在开发 Lucenes MoreLikeThis 的修改版本,以适应我自己的目的。有一件事我仍然无法理解。创建队列时,MoreLikeThis 会搜索该词条 docFreq 最高的字段。

该字段将在 TermQuery 中使用。这会产生奇怪的结果。

例如,假设您有两个字段,“title”和“body”,并且有两个具有完全相同标题的文档,但它们不会匹配,因为“title”中的所有单词在其他文档中出现的频率更高“身体”,反之亦然。这对我来说似乎很奇怪。

另一个例子:我在一个系统中使用它,该系统通过与用户相关的访问权限过滤结果,并且发生查询的用户无法看到导致所选字段的高 docFreq 的文档。生成的查询没有找到任何文档,尽管用户可以看到很多文档,其中包含确切的术语,只是在错误的字段中。

我想知道为什么他们不只使用所有字段,或者至少使用术语最初出现的字段。当然,这可能是性能问题。但我已经实现它以使用原始文档中出现该术语的所有字段,以及具有最高 docFreq 的字段。我在包含数千个文档的索引上对其进行了测试,但看不出有任何区别(但我没有做任何基准测试)。

那么,谁能告诉我为什么要这样实现?我能想到的唯一原因是在具有很多字段的非常大的索引上表现出色。

//编辑:我实现了第一个例子来澄清问题: http: //pastebin.com/fwdENb3F

0 投票
2 回答
321 浏览

java - 将 Lucene 的 MoreLikeThis 限制为我的文档的一个子集

我正在使用 Lucene 来索引我网站的内容并提供搜索工具。我还使用 Lucene 的 MoreLikeThis 为该站点生成“相关页面”工具。我的网站是多语言的,所以我需要一次将 MoreLikeThis 限制为一种特定的语言。

任何人都知道如何做到这一点?

0 投票
0 回答
406 浏览

elasticsearch - 更像这样的数组

每个文档都有一个包含每个元素权重的数组。如何获得最相似的文档数组。我认为 more_like_this 功能相同,但带有文本。当然需要通过elasticsearch的工具来实现。

[“str”:int,“str”:int,...]