问题标签 [scoring]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - 在 Lucene 中,术语如何用于计算分数,我可以用 CustomScoreQuery 覆盖它吗?
是否有人成功地覆盖了查询中的文档评分,以便可以通过自己的功能确定术语与字段内容的“相关性”?如果是这样,是通过实现CustomScoreQuery并覆盖 customScore(int, float, float) 吗?我似乎找不到一种方法来构建自定义排序或自定义记分器,它可以将精确术语匹配的排名远高于其他前缀术语匹配。任何建议,将不胜感激。
algorithm - 计算游戏中相对于先前分数和其他玩家的最终分数
假设一个多人游戏,你最公平的方法是根据所有玩家之前的分数给出最终分数。
例如,在一场两人比赛中,球员 A 的得分是球员 B 的两倍。“A”先完成不会给他很多分;最后,他会失去很多积分。
algorithm - 订购最大距离的数字集
您有(最多 100 个)不同的(2-4)组数字。集合或集合中数字的顺序无关紧要。最高的数字与套数有关,最高可达 30。如:
{1 2 3 4} {1 2 3 5} {1 2 3} {1 2 4 5} {6 2 4} {6 7 8 9} {6 7 9} {7 8 9} {2 4 8 9}
目标是按特定顺序排列这些集合,其中两个连续的集合不包含共同的数字。那是
{1 2 3 4} {2 4 8 9}
不好(因为 2)。和
{1 2 3 4} {6 7 8 9}
很好。
当然,尤其是在给定的示例中,这对于整个集合是不可能的。但是违反规则的集合的数量应该近似地最小化。
我假设,对于相对大量的集合,一些蛮力+评分算法是不可行的。对于确定性算法来解决此问题,您有任何其他想法或提示吗?
您认为 shuffle + score 算法可以找到不错的解决方案吗(在某些有限的时间范围内,例如 5 秒,标准计算机)?
lucene - Lucene评分问题
我对 Lucene 的评分功能有疑问,我无法弄清楚。到目前为止,我已经能够编写这段代码来重现它。
我从运行它得到的输出是:
我只是不明白为什么the rolling stones
与the rolling stones tribute
. 根据 lucene 的文档,一个字段的标记越多,归一化因子应该越小,因此the rolling stones tribute
应该比the rolling stones
.
有任何想法吗?
java - 使用不同搜索空间大小的不同lucene搜索结果
我有一个使用 lucene 进行搜索的应用程序。搜索空间以千计。搜索这数千个结果,我只得到几个结果,大约 20 个(这是可以预期的)。
但是,当我将搜索空间减少到仅这 20 个条目时(即,我只索引了这 20 个条目并忽略其他所有内容......这样开发会更容易),我得到相同的 20 个结果,但顺序不同(和评分) .
我尝试通过 Field#setOmitNorms(true) 禁用规范因子,但我仍然得到不同的结果?
什么可能导致得分的差异?
谢谢
solr - 根据包含命中的字段提升 Solr 结果
我在浏览网页寻找索引和搜索框架时偶然发现了 Solr。我们绝对需要的一个功能是根据包含命中的字段来提升结果。
一个小例子:
考虑这样的记录:
例如,我想将title
,alternative_title
和plot
字段组合成一个搜索字段,这在查看 Solr/Lucene 文档和教程后并不难。
但是,我也希望获得成功的电影title
的得分高于热门电影,而那些电影的得分alternative_title
应该高于该plot
领域的热门电影。
有什么方法可以在 XML 中表示这种评分,还是我们需要开发一些自定义评分算法?
另请注意,我给出的示例是虚构的,真实数据可能包含 100 多个字段。
java - Lucene 文档提升
我在 lucene 提升方面遇到问题,我正在尝试提升与指定的(名字)字段匹配的特定文档我已经发布了部分代码
为什么这不起作用?
提前谢谢你
algorithm - 对用户活动进行评分的算法
我有一个应用程序,用户可以:
- 撰写有关产品的评论
- 为产品添加评论
- 赞成/反对投票评论
- 赞成/反对投票评论
每个赞成/反对票都记录在数据库表中。
我现在要做的是创建过去 4 周内最活跃用户的排名。当然,好的评论应该比好的评论更重要。但是,例如,10 条好的评论应该比一篇好的评论更重要。
例子:
一个公平的评分函数会是什么样子?该功能的实现如何score()
?如何为g
函数添加权重,使评论的权重更重?例如,如果添加图片投票,这样的功能会是什么样子?
overflow - 不必要的限制 - 温布尔登网球记分牌
http://en.wikipedia.org/wiki/Isner%E2%80%93Mahut_match_at_the_2010_Wimbledon_Championships
因此,有史以来最长的网球比赛以 47-47 打破了场上的记分牌,并以 50-50 打破了网站。
至少对于千年虫来说,日期是以两位数存储的。
这里有什么借口,程序没有为完美风暴做好准备,甚至像这样受到不必要的限制的情况有多普遍?
comparison - lucene vs solr 评分
有人可以用更简单的语言解释(或引用参考)来比较 SOLR 和 LUCENE 使用的评分机制。它们有什么区别吗?
我不太擅长 solr/lucene,但我的发现表明它们是不同的。
PS:我只是尝试了一个简单的查询,比如“+Contents:risk”,并没有使用任何过滤器。