问题标签 [scoring]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1290 浏览

lucene - 在 Lucene 中,术语如何用于计算分数,我可以用 CustomScoreQuery 覆盖它吗?

是否有人成功地覆盖了查询中的文档评分,以便可以通过自己的功能确定术语与字段内容的“相关性”?如果是这样,是通过实现CustomScoreQuery并覆盖 customScore(int, float, float) 吗?我似乎找不到一种方法来构建自定义排序或自定义记分器,它可以将精确术语匹配的排名远高于其他前缀术语匹配。任何建议,将不胜感激。

0 投票
3 回答
919 浏览

algorithm - 计算游戏中相对于先前分数和其他玩家的最终分数

假设一个多人游戏,你最公平的方法是根据所有玩家之前的分数给出最终分数。

例如,在一场两人比赛中,球员 A 的得分是球员 B 的两倍。“A”先完成不会给他很多分;最后,他会失去很多积分。

0 投票
2 回答
265 浏览

algorithm - 订购最大距离的数字集

您有(最多 100 个)不同的(2-4)组数字。集合或集合中数字的顺序无关紧要。最高的数字与套数有关,最高可达 30。如:

{1 2 3 4} {1 2 3 5} {1 2 3} {1 2 4 5} {6 2 4} {6 7 8 9} {6 7 9} {7 8 9} {2 4 8 9}

目标是按特定顺序排列这些集合,其中两个连续的集合不包含共同的数字。那是

{1 2 3 4} {2 4 8 9}

不好(因为 2)。和

{1 2 3 4} {6 7 8 9}

很好。

当然,尤其是在给定的示例中,这对于整个集合是不可能的。但是违反规则的集合的数量应该近似地最小化。

我假设,对于相对大量的集合,一些蛮力+评分算法是不可行的。对于确定性算法来解决此问题,您有任何其他想法或提示吗?

您认为 shuffle + score 算法可以找到不错的解决方案吗(在某些有限的时间范围内,例如 5 秒,标准计算机)?

0 投票
2 回答
1122 浏览

lucene - Lucene评分问题

我对 Lucene 的评分功能有疑问,我无法弄清楚。到目前为止,我已经能够编写这段代码来重现它。

我从运行它得到的输出是:

我只是不明白为什么the rolling stonesthe rolling stones tribute. 根据 lucene 的文档,一个字段的标记越多,归一化因子应该越小,因此the rolling stones tribute应该比the rolling stones.

有任何想法吗?

0 投票
2 回答
1713 浏览

java - 使用不同搜索空间大小的不同lucene搜索结果

我有一个使用 lucene 进行搜索的应用程序。搜索空间以千计。搜索这数千个结果,我只得到几个结果,大约 20 个(这是可以预期的)。

但是,当我将搜索空间减少到仅这 20 个条目时(即,我只索引了这 20 个条目并忽略其他所有内容......这样开发会更容易),我得到相同的 20 个结果,但顺序不同(和评分) .

我尝试通过 Field#setOmitNorms(true) 禁用规范因子,但我仍然得到不同的结果?

什么可能导致得分的差异?

谢谢

0 投票
3 回答
10725 浏览

solr - 根据包含命中的字段提升 Solr 结果

我在浏览网页寻找索引和搜索框架时偶然发现了 Solr。我们绝对需要的一个功能是根据包含命中的字段来提升结果。

一个小例子:

考虑这样的记录:

例如,我想将title,alternative_titleplot字段组合成一个搜索字段,这在查看 Solr/Lucene 文档和教程后并不难。
但是,我也希望获得成功的电影title的得分高于热门电影,而那些电影的得分alternative_title应该高于该plot领域的热门电影。
有什么方法可以在 XML 中表示这种评分,还是我们需要开发一些自定义评分算法?

另请注意,我给出的示例是虚构的,真实数据可能包含 100 多个字段。

0 投票
1 回答
1917 浏览

java - Lucene 文档提升

我在 lucene 提升方面遇到问题,我正在尝试提升与指定的(名字)字段匹配的特定文档我已经发布了部分代码

为什么这不起作用?

提前谢谢你

0 投票
1 回答
899 浏览

algorithm - 对用户活动进行评分的算法

我有一个应用程序,用户可以:

  1. 撰写有关产品的评论
  2. 为产品添加评论
  3. 赞成/反对投票评论
  4. 赞成/反对投票评论

每个赞成/反对票都记录在数据库表中。

我现在要做的是创建过去 4 周内最活跃用户的排名。当然,好的评论应该比好的评论更重要。但是,例如,10 条好的评论应该比一篇好的评论更重要。

例子:

一个公平的评分函数会是什么样子?该功能的实现如何score()?如何为g函数添加权重,使评论的权重更重?例如,如果添加图片投票,这样的功能会是什么样子?

0 投票
1 回答
178 浏览

overflow - 不必要的限制 - 温布尔登网球记分牌

http://en.wikipedia.org/wiki/Isner%E2%80%93Mahut_match_at_the_2010_Wimbledon_Championships

因此,有史以来最长的网球比赛以 47-47 打破了场上的记分牌,并以 50-50 打破了网站。

至少对于千年虫来说,日期是以两位数存储的。

这里有什么借口,程序没有为完美风暴做好准备,甚至像这样受到不必要的限制的情况有多普遍?

0 投票
2 回答
1679 浏览

comparison - lucene vs solr 评分

有人可以用更简单的语言解释(或引用参考)来比较 SOLR 和 LUCENE 使用的评分机制。它们有什么区别吗?

我不太擅长 solr/lucene,但我的发现表明它们是不同的。

PS:我只是尝试了一个简单的查询,比如“+Contents:risk”,并没有使用任何过滤器。