问题标签 [partial-sort]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
332 浏览

sorting - 如何在 Spark DataFrame 上应用部分排序?

以下代码:

输出:

Spark 的懒惰与limit调用和orderBy自动实现的结合是否会导致部分排序的 DataFrame,或者剩余的 7 个数字是否也已排序,即使它不需要?如果是这样,有没有办法避免这种不必要的计算工作?


使用.explain()显示,执行两个排序阶段,首先在每个分区上,然后(每个前 3 个)一个全局阶段。但它没有说明这些种类是完整的还是部分的。

0 投票
0 回答
24 浏览

python - Python 和 numpy:在给定一批新样本的情况下维护一个最高值的列表(或 numpy 数组)?

假设我们有一堆样本 x 和样本 S 的分数。我们想要维护我们见过的顶部 n_store 的存储。鉴于新示例来自 numpy 数组,在 python 中执行此操作的最佳方法是什么?

有多种方法,但您可能从一些具有如下签名的函数开始:

有多种选择,例如维护排序列表 S_old 或使用 numpy.argpartition。可能我只需要测试每种情况,还需要选择回声系统中的各种工具。而且我通常希望最终将信息作为 numpy 数组进行更多计算,因此如果我不能做任何指针技巧,将数字从 numpy 移动到列表或其他结构(反之亦然)可能会产生成本。

0 投票
0 回答
41 浏览

c++ - partial_sort 与列表的“前 N 个”元素有何相同之处?

学习 C++,我正在阅读标准算法,参考页面在 partial_sort 上说以下内容:

但是当我单击函数的名称时,这就是它对同一函数的含义:

我看不出这两个怎么一样!考虑到将要排序的项目包含partial_sort一个迭代器 ( middle) 的事实,我认为它与“top N”不同。如果我想使用这个输入来实现“top N”,这意味着我必须有一个指向集合的第 N 个项目的迭代器。但是如果列表没有排序,我怎么知道哪一项是第 N 项呢?