问题标签 [ranking-functions]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:拆分 - 应用 - 组合以获得累积变量
这是 df 的一个小代表:
我想为每个团队创建一个新的变量/列,根据日期从最旧到最近的游戏对不同的游戏进行排名。
输出将如下所示:
我想到了拆分 - 应用 - 与排名功能相结合,但我无法让它发挥作用。
sql - 如何在不划分分区并将每个桶加一的情况下使用ntile
如何在ntile
不指定划分每个分区的数字的情况下使用排名功能,而是为每个分区分配一个递增的数字?
我想对具有相同值的字段子集的项目进行分组,然后用相同的数字标记它们,以便每个组的数字按排序顺序递增一。
excel - 用于将用户反馈评为五颗星的公式是什么
我有一个 Excel 表,其中包含用户反馈(优秀、非常好、好、差、非常差),每个单元格都有数字。
我可以用什么公式来为每个用户获得 5 星的排名。
elasticsearch - 如何检测具有人气计数的趋势项目?
我用elasticsearch制作了一个搜索应用程序。项目有名称和追随者数量。我使用追随者数量来提升弹性搜索结果。
例如:假设我有两个项目。item_1 = [name = "abc def",追随者 = 1000] 和 item_2 = [name = "abc",追随者 = 10]。
因此,当用户搜索“abc”时,即使 item_2 完全匹配,我也会将 item_1 作为最可能的结果。这对我来说很好。但我想为此添加新功能。
我希望能够检测到流行的项目并提高他们的分数。
所以,我想如果我每天存储关注者数量一周或一个月。喜欢;
因此,如果项目 1、2、3 和 4 的每日追随者数量像这样增加。那么,我应该能够检测到项目 2 的追随者数量的增加,并将其提高到项目 1。因为,即使项目 1 有更多的追随者,第 2 项每天都有更多的追随者。但是,第 3 项不应超过第 4 项,因为第 3 项的增加百分比非常小。
底线,我希望能够检测到越来越受欢迎,但它应该基于增加百分比。
那么,您对此有什么建议吗?或者你能参考任何帮助我解决这个问题的论文吗?
sql - 查找Salesperson第二高的销售SQL
我有 3 张明显的桌子,销售人员、订单和客户。在订单表中,我列出了所有订单和 SalesPersonID。
我想找到每个有超过 2 个订单的销售人员,并找到第二高订单的订单价值。如果我被要求找到最大订单价值,我可以完成此查询,但我似乎无法找到一种简单的方法来获得第二高的价值。
这里是新手,所以请放轻松。提前致谢。
在过去的 3 个小时里,我绞尽脑汁阅读有关 ROW_Number 和 Rank 的信息,但无法弄清楚。而且我确信有比编写我自己的自定义函数更简单的方法
mysql - 使用组内的记录排名更新 MySQL 表
我有一个名为 'winners' 的表格,其中包含 'id'、'category'、'score'、'rank' 列。
我需要更新我的表并在子类别 (category_id) 中指定一个排名,根据样本,该排名为 2,但将来可能会更多。
我发现的大多数答案都是基于 select 语句,这些语句只是倾向于输出表格视图,但我确实找到了一个非常好的“更新”答案(https://stackoverflow.com/a/2727239/4560380)特别是答案更新领带必须共享相同的排名。
样本
当只有一个类别需要担心时,上面的链接答案非常适用于数据,但当有多个类别或子组要在其中进行排名时则不行。
我曾尝试在代码中添加 where 子句(第 8 行)
试图为每个 category_id 运行代码两次,但脚本失败。
为多个类别修改上述答案的任何选项都很棒。
需要的结果只是为了澄清(在类别中排名)。
多谢你们!
更新
设法找到另一段代码https://stackoverflow.com/a/13270603/4560380,我最初以某种方式错过了它,并且能够成功地使用每个 category_id 的 where 子句对其进行修改。这不是一种理想的方式 - 为多个类别运行多次,但此时它很好。
在 1 个脚本运行中对排名中的多个类别进行更“自动”处理的进一步答案仍然非常受欢迎和赞赏。
谢谢
更新
只是注意到我找到的答案不能很好地处理零分数(0.00),并将它们排在其他分数的中间。
下面的 shawnt00 答案正在工作并正确评估零分数。 https://stackoverflow.com/a/34667112/4560380
nlp - 如何选择 OKAPI BM25 参数:b 和 k1
我实际上想知道,我们如何验证或评估 BM25 公式中 b 和 k1 的值?换句话说,最“科学”的评估方法是什么?
是否有任何研究论文可供我们参考,以了解此类评估是如何进行的?
python - DataFrame:添加其值为现有列的分位数/排名的列?
我有一个带有一些列的 DataFrame。我想添加一个新列,其中每一行值是一个现有列的分位数等级。
我可以使用 DataFrame.rank 对列进行排名,但是我不知道如何获取此排名值的分位数并将此分位数添加为新列。
示例:如果这是我的 DataFrame
我想知道b列的分位数(使用2个分位数)。我期望这个结果:
ranking - 如何在excel中按时间顺序排列项目
这是4人得分的名单。
杰克 23 鲍勃 25 洛蒂 45 山姆 25
如果我使用 rank.eq 函数,那么它会给出 lorty-1、bob-2、sam-2 和 jack-4 的排名有什么方法可以使排名成为 lorty-1、bob-2、sam-2 和 jack-3
algorithm - 我们可以合并来自有些相似的数据集的排名以产生全球排名吗?
另一种问这个问题的方法是:我们可以使用来自不同数据集的相对排名来产生全球排名吗?
假设我有各种数据集,它们根据婴儿动物的可爱标准进行排名:1)小猫,2)小狗,3)树懒,4)大象。我使用成对比较(即,向人们展示两张动物的随机图片并要求他们选择最可爱的一张)来获得这些排名。我也有数据集中的全部比较(即,所有小狗在小狗数据集中相互比较)。
我现在正在尝试将数据集合并在一起,以生成最可爱动物的全球排名。
相对排名的主要问题是一组中最可爱的动物不一定是另一组中最可爱的。例如,假设小象被认为没有吸引力,那么最不可爱的小猫总是会击败最可爱的大象。我应该如何解决这个问题?
我正在考虑对数据集(小猫与大象、小狗与小猫等)进行一些交叉比较,以创建某种基本重要性,但是当我添加动物的数量和动物的类型时,这可能会成为问题。
我也在考虑进一步研究填充稀疏矩阵,但我认为这仅适用于一个数据集,而不是跨多个数据集进行比较?