问题标签 [ranking-functions]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
5123 浏览

sql - Hive 中的窗口函数

我正在探索 Hive 中的窗口函数,并且能够理解所有 UDF 的功能。虽然,我无法理解我们与其他函数一起使用的 partition by 和 order by。以下是与我计划构建的查询非常相似的结构。

只是试图了解这两个关键字所涉及的后台过程。

感谢帮助:)

0 投票
1 回答
699 浏览

scala - 如何使用 Scala 在 Spark 中进行滑动窗口排名?

我有一个数据集:

我首先根据“计数”对数据集进行排名。

我现在正在尝试使用 row_number(4 行)上的滚动窗口对内容进行排名,并根据 model_score 在窗口内排名。例如:

在第一个窗口 row_number 1 到 4 中,新排名(新列)将为

在第一个窗口中,row_number 5 到 8,新排名(新列)将为

在第一个窗口,row_number 9 休息,新的排名(新列)将是

有人可以告诉我如何使用这个 spark 和 Scala 来实现吗?有没有我可以使用的预定义函数?

我试过 :

惰性值 MODEL_RANK = Window.partitionBy(col(QUERY)) .orderBy(col(MODEL_SCORE).desc).rowsBetween(0, 3)

但这给了我:

另外,尝试使用 .rowsBetween(-3, 0) 但这也给了我错误:

0 投票
0 回答
68 浏览

arrays - MQL5:如何对数组的值进行排名

我使用 R 和 rank 函数为原始 var 创建以下等级x

我正在努力min在 MQL5 中实施 -version。首先,您可能需要对数组进行排序,但您需要注意原始顺序。如何手动分配等级是很合乎逻辑的,但我不知道如何在 MQL5 中实现这一点。

0 投票
2 回答
58 浏览

sql-server - 如果员工的薪水高达 5000 则排名 =1,高达 100k 则排名 = 2,依此类推。我们可以使用 rank 函数得到结果吗?

如果员工的工资低于 50,000 则排名 = 1,最高 100 000 则排名 2,最高 150 000 则排名 3。我可以使用排名函数得到这个吗?

0 投票
0 回答
525 浏览

python - 基于多个变量创建统计上正确的排名

我有一个表格,其中包含主要列的文档名称:

文档标题、创建日期、下载次数排名(星号:从 0 到 5)、
文档排名次数

唯一总是填写数据的字段是: 文档标题、创建日期

总体排名的正确公式是什么,以便用户可以看到哪些文档是最受欢迎的,考虑到: 创建日期、下载次数、排名(星号:从 0 到 5)、文档排名的次数

例如,如果昨天创建的文档只有一个5 星10次下载的排名,那么它的总体排名不能高于已发布2 年且下载量为数百次的文档,即使它只有 4 星

谢谢

0 投票
2 回答
52 浏览

r - 对于每个唯一 ID,我希望只有一行基于另一个字段的排名

最终,我希望创建一个表,其中包含我在数据集中拥有的每个唯一 ID 以及相应字段,基于该字段的“排名”。

我一直非常坚持这一步。我考虑过为每个唯一 ID 循环,但想看看是否有更简单的方法。或许 apply 系列函数会有所帮助。我也不确定对不同字符串值进行排名的方法(例如,TRUE > FALSE > NA)。

下面是我正在查看的一个小样本,只有两个感兴趣的领域:

对于每个 ID:

  • 如果标志字段中至少有一个“TRUE”,我想拉出这些整行中的一个(不管是哪一个)。
  • 如果一个 ID 在标志字段中不包含“TRUE”值,但在至少一行中有“FALSE”,我想提取其中一整行。
  • 如果 ID 在标志字段中没有“TRUE”或“FALSE”值,我仍然想要“NA”行之一。

以下是我希望拥有的单独数据框:

提前感谢您的帮助!

0 投票
2 回答
359 浏览

sql-server - 如何按一列排序,但根据不同的非数字列进行排名?

我有四列要排名。它们需要按员工 ID 分组,然后按订单号从低到高列出。然后当一切都井井有条时,我真的想得到城市在该顺序中的排名。如果同一名员工的同一个城市一个接一个地列出,那么我希望那些排名相同。

下表的示例如下。顺序是正确的,但排名不是我想要做的。

我实际上想要的结果是:

然后我最终会删除重复的城市,最终得到:

0 投票
1 回答
215 浏览

sql - 如何根据某些条件和多条件删除SQL表中的重复记录?

下表由 EmployeeID、JobNum、CompDate 列组成。基本上有 3 名不同的员工具有特定的工作 ID 和与他们相关的完成日期时间。有一些 jobNum 与特定的 EmployeeID 没有关联,并且可能有一个完整的日期。

问题:1) 当 Complete date 不为 null 或填充了日期时,删除 EmployeeID 的记录。

2) 当该 EmployeeID 的记录包含一个空缺职位时(当 JobNum 不为 NULL 且 CompDate 为 NULL 时),删除该员工的 JobNum 和 CompDate 列都具有空值的记录。这是重复的。

尝试使用带有案例陈述的排名函数。排名不正确。

0 投票
1 回答
255 浏览

python - 如何从 Tensorflow 排名系统获取输出文件中的分数?

我无法从评分函数中获取每行的分数作为输出。

我正在使用评分函数在 Jupyter 笔记本中使用 Python 在推荐引擎中对我的文档进行排名。我正在使用下面的代码来评估我的测试数据 -

上面的代码给了我 logits_mean 和其他指标。现在我需要输出文件对我的测试数据的每一行都有分数,就像我们在任何其他 ml 分类问题中得到预测输出一样。请帮忙!

0 投票
1 回答
29 浏览

excel - Excel公式帮助 - 商业累积书

我希望能就所附的工作簿获得帮助。最终目标是能够标记占代表累积活动 70% 的客户。我已经在 H 列中手动完成了这项工作,但想要一个可靠的公式来完成这项工作。我正在考虑像 Offset/Indirect/Cell"Address"/Index/Match/Match/Countifs 或 CountA 这样的堆栈会起作用,但有点困惑。原始源数据位于 BD 列中,由 PowerPivot 组成。

通过 PowerQuery 提出的任何想法也将受到欢迎,我可以为此提供任何必要的细节。

非常感谢您!!!

约旦

工作簿截图