问题标签 [ranking-functions]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - Hive 中的窗口函数
我正在探索 Hive 中的窗口函数,并且能够理解所有 UDF 的功能。虽然,我无法理解我们与其他函数一起使用的 partition by 和 order by。以下是与我计划构建的查询非常相似的结构。
只是试图了解这两个关键字所涉及的后台过程。
感谢帮助:)
scala - 如何使用 Scala 在 Spark 中进行滑动窗口排名?
我有一个数据集:
我首先根据“计数”对数据集进行排名。
我现在正在尝试使用 row_number(4 行)上的滚动窗口对内容进行排名,并根据 model_score 在窗口内排名。例如:
在第一个窗口 row_number 1 到 4 中,新排名(新列)将为
在第一个窗口中,row_number 5 到 8,新排名(新列)将为
在第一个窗口,row_number 9 休息,新的排名(新列)将是
有人可以告诉我如何使用这个 spark 和 Scala 来实现吗?有没有我可以使用的预定义函数?
我试过 :
惰性值 MODEL_RANK = Window.partitionBy(col(QUERY)) .orderBy(col(MODEL_SCORE).desc).rowsBetween(0, 3)
但这给了我:
另外,尝试使用 .rowsBetween(-3, 0) 但这也给了我错误:
arrays - MQL5:如何对数组的值进行排名
我使用 R 和 rank 函数为原始 var 创建以下等级x
:
我正在努力min
在 MQL5 中实施 -version。首先,您可能需要对数组进行排序,但您需要注意原始顺序。如何手动分配等级是很合乎逻辑的,但我不知道如何在 MQL5 中实现这一点。
sql-server - 如果员工的薪水高达 5000 则排名 =1,高达 100k 则排名 = 2,依此类推。我们可以使用 rank 函数得到结果吗?
如果员工的工资低于 50,000 则排名 = 1,最高 100 000 则排名 2,最高 150 000 则排名 3。我可以使用排名函数得到这个吗?
python - 基于多个变量创建统计上正确的排名
我有一个表格,其中包含主要列的文档名称:
文档标题、创建日期、下载次数排名(星号:从 0 到 5)、
文档排名次数
唯一总是填写数据的字段是: 文档标题、创建日期
总体排名的正确公式是什么,以便用户可以看到哪些文档是最受欢迎的,考虑到: 创建日期、下载次数、排名(星号:从 0 到 5)、文档排名的次数
例如,如果昨天创建的文档只有一个5 星和10次下载的排名,那么它的总体排名不能高于已发布2 年且下载量为数百次的文档,即使它只有 4 星
谢谢
r - 对于每个唯一 ID,我希望只有一行基于另一个字段的排名
最终,我希望创建一个表,其中包含我在数据集中拥有的每个唯一 ID 以及相应字段,基于该字段的“排名”。
我一直非常坚持这一步。我考虑过为每个唯一 ID 循环,但想看看是否有更简单的方法。或许 apply 系列函数会有所帮助。我也不确定对不同字符串值进行排名的方法(例如,TRUE > FALSE > NA)。
下面是我正在查看的一个小样本,只有两个感兴趣的领域:
对于每个 ID:
- 如果标志字段中至少有一个“TRUE”,我想拉出这些整行中的一个(不管是哪一个)。
- 如果一个 ID 在标志字段中不包含“TRUE”值,但在至少一行中有“FALSE”,我想提取其中一整行。
- 如果 ID 在标志字段中没有“TRUE”或“FALSE”值,我仍然想要“NA”行之一。
以下是我希望拥有的单独数据框:
提前感谢您的帮助!
sql-server - 如何按一列排序,但根据不同的非数字列进行排名?
我有四列要排名。它们需要按员工 ID 分组,然后按订单号从低到高列出。然后当一切都井井有条时,我真的想得到城市在该顺序中的排名。如果同一名员工的同一个城市一个接一个地列出,那么我希望那些排名相同。
下表的示例如下。顺序是正确的,但排名不是我想要做的。
我实际上想要的结果是:
然后我最终会删除重复的城市,最终得到:
sql - 如何根据某些条件和多条件删除SQL表中的重复记录?
下表由 EmployeeID、JobNum、CompDate 列组成。基本上有 3 名不同的员工具有特定的工作 ID 和与他们相关的完成日期时间。有一些 jobNum 与特定的 EmployeeID 没有关联,并且可能有一个完整的日期。
问题:1) 当 Complete date 不为 null 或填充了日期时,删除 EmployeeID 的记录。
2) 当该 EmployeeID 的记录包含一个空缺职位时(当 JobNum 不为 NULL 且 CompDate 为 NULL 时),删除该员工的 JobNum 和 CompDate 列都具有空值的记录。这是重复的。
尝试使用带有案例陈述的排名函数。排名不正确。
python - 如何从 Tensorflow 排名系统获取输出文件中的分数?
我无法从评分函数中获取每行的分数作为输出。
我正在使用评分函数在 Jupyter 笔记本中使用 Python 在推荐引擎中对我的文档进行排名。我正在使用下面的代码来评估我的测试数据 -
上面的代码给了我 logits_mean 和其他指标。现在我需要输出文件对我的测试数据的每一行都有分数,就像我们在任何其他 ml 分类问题中得到预测输出一样。请帮忙!