问题标签 [ranking-functions]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - 如何根据时间选择第一条记录
我有两张桌子和一张通话桌和一张电话后工作桌。这两个表具有一对一的关系,即使呼叫后的工作记录存储在呼叫表中。通过加入呼叫表中的三个值,您可以将呼叫链接到呼叫后工作呼叫。调用表还保存调用的开始和结束时间的值。
呼叫后工作表中的数据是一团糟,有时一个呼叫有很多呼叫后工作记录。我的客户希望我根据通话的开始时间挑选出第一条记录,并且只取这 1 行数据。
有人建议使用 RANKING 功能,但我不熟悉这个任何人有什么想法吗?
如果有什么需要进一步解释的,请告诉我。
谢谢
sql - Select one row per group without specifying order?
Suppose I have this data:
And this query:
It successfully returns me one person per unique name.
However, in order to use row_number()
, I must specify an order by
, causing the query plan to include an expensive sort operation.
I don't care about which person is returned; I just need one person per name.
Is there a way to do this without the sorting?
You can see my query and execution plan here: http://sqlfiddle.com/#!3/3ee32/1/0
sql - 选择 MAX 并添加 1 (SQL Server 2012)
我希望该过程从 #ID 中获取最大 ID,然后为下一条记录添加 1。所以,预期的结果应该是:
请帮助我在不使用游标的情况下绕过这个逻辑。我可以以任何方式使用 IDENTITY(@ID,1) 吗?谢谢
algorithm - 具有子节点的节点的排名算法?
我正在一个网站上工作,那里有用户可以投票的节点(upvotes/downvotes)。每个节点都有一个子节点列表。用户也可以对这些子节点中的每一个进行投票。想想 reddit 上的帖子和评论之间的关系。
有哪些排名算法可以帮助我根据节点自己的分数以及子节点的分数对节点进行排序?我已经查看了 reddit 的“热”排名算法,但不幸的是我没有看到我将如何考虑子节点排名。
perl - Perl:如何进行最佳排名
我的兄弟有成千上万的物品 ID 和以下列方式出售的物品数量:
此信息来自读取日志。在 Perl 中,此数据定义为:
其中: $item_id_sold_count_map 是一个哈希,@items_ids 是这种哈希的键。作为参考,哈希来自读取日志文件,正如我之前提到的:
我想在排名中介绍这一点。标准将是“sold_items”,按降序排列。例如,我想到将其以如下数据结构呈现:
如何创建此数据结构?虽然我没有确切地寻找“最佳”方式,但大约有 500,000 项。
machine-learning - 机器学习中逐点排序和成对排序有什么区别
我一直在阅读有关成对排名的论文,这是我没有得到的:
逐点排序和成对排序之间的训练/测试数据有什么区别?这是我一直在阅读的论文: http ://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf
在那里,它说成对排名中的数据点是两个链接之间的不等式:
[行] .=。[两个链路之间的不等式,即目标] qid:[qid] [[链路 1 和 2 的特征]:[1 和 2 的值]] # [信息]
然而, RankLib确实支持 RankNet 和 RankBoost 等成对排名器,但它使用的数据点格式是逐点的
[行] .=。[绝对排名,也就是目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ... # [info]
有什么我想念的吗?
r - 使用条件对变量进行排名
假设我有以下数据框:
我想根据 对商店进行排名successRate
,关系到销售额更高的商店,所以首先我这样做(只是为了使可视化更容易):
为了实际创建排名变量,我执行以下操作:
所以df
看起来像这样:
问题是我不希望小商店成为排名的一部分。具体来说,我希望销售额低于 50 的商店不被排名。所以这就是我定义的df$rank
方式:
问题是,即使这正确删除了商店 E 和 A,它也不会重新分配它们所占据的排名。df
现在看起来像这样:
我已经尝试过内外条件ave()
,但我不能让 R 做我想做的事!我怎样才能让它像这样对商店进行排名?
r - 根据过去的表现选择交易规则
我正在尝试使用 Quantmod、PerformanceAnalytics 和 Systematic Investors Toolbox 开发交易系统。
我想根据每日数据创建和测试一些简单的交易规则(价格 > SMA)、(rsi 2 < 0.5 = 多头)等(这部分工作正常)。
然后,我想根据它们在前 X 天的表现对这些策略进行排名。然后我想选择前3名的策略,50%投资前1名,30%投资第二名,20%投资第三名。这就是我的问题所在,因为我不知道该怎么做。
我研究了 Systematic Investor Toolbox 或 Rank 功能的一些功能,并查看了过去的问题,但未能成功地让这些功能发挥作用。
最终,我只想每月重新平衡一次策略权重,但让我们一次解决一个问题。
以下是我迄今为止测试策略和创建滚动性能的代码:
这基本上就是我所拥有的。我可以创建和测试策略,但我不知道如何自动对策略进行排名并只选择前 3 个。
如果您需要更多信息,请告诉我!任何帮助将不胜感激!提前致谢
sql - 如何在 SQL Server 2012 中添加行号列
我正在尝试向现有表添加一个新列,其中值是行号/排名。我需要一种方法来生成行号/排名值,并且我还需要限制受影响的行——在这种情况下,字符串中存在子字符串。
现在我有:
我得到这个错误:
(同样的错误RANK()
)
有没有办法使用 ROW_NUMBER() 函数创建/更新列?仅供参考,这是为了替换不正确的、已经存在的“等级”列。
sql - 对连续记录进行分组、计数和删除
我有一个棘手的 SQL 问题。这是基于 SQL Server 2008 R2。
从 Log 表中,我必须合并具有相同消息的连续记录 ( MSG
),计算合并的消息数 ( COUNT
),然后删除重复的消息。这也需要在一个日期范围内完成,以便该范围之外的任何记录都不会受到影响。
为了使这更容易理解,这里是数据的一个小例子:
结果应如下所示:
所以,基本上,查询应该
- 仅处理给定日期范围内的数据(在此示例中为 from
2013-08-18
to2013-08-22
) - 根据
MSG
字段的文本组合连续的行 - 计算组合数据并在
COUNT
字段中设置值 - 删除重复记录(在此示例中,例如 ID 6 保留,但 ID 5 和 ID 4 应删除)
由于我不是 SQL 专家,因此我非常感谢任何帮助、建议或 SQL 查询。