c++ - C ++：在子数组的数组中查找最大整数

Question

我面临一个问题，我想编写一个算法，该算法可以返回更大数组中每个连续 k 元素子数组的最大元素，并将这些最大元素读入它们自己的数组，如下所示：

Given int array = {3, 7, 20, 6, 12, 2, 0, 99, 5, 16}, and int k = 4,
--> creates the array {20, 20, 20, 12, 99, 99, 99} 
[because there are 7 consecutive sub-arrays of size 4 within the given array:
{3, 7, 20, 6}, {7, 20, 6, 12}, {20, 6, 12, 2}, ... , {0, 99, 5, 16}
and the max element of these, respectively, is 20, 20, 20, ..., 99 which 
are read into the resulting array.

现在这是我的问题：我知道如何在 O(n^2) 复杂度中实现这一点，但希望让它更快，以便它可以是 O(n)，或者如果这不可能，O(nlog(n)) . 有谁知道是否有更快的方法来做到这一点，如果有，怎么做？

score 1 · Accepted Answer

首先，朴素算法的复杂度是O(k(n-k+1))（通常这近似于O(kn)），而不是O(n^2)。这就是，对于每个连续的子数组（可能有n-k+1 个），您必须执行k个比较。

通过一些记忆，您可以做得比这更好，使用长度为k的附加数组，我们可以调用它maximums。该数组将存储下一个最大值的索引。

对于数据集的每次迭代，您检查maximums. 您删除所有“过期”索引，现在第一个元素是您对当前迭代的答案。

当您在数据上滑动一个窗口（大小为k）时，将当前索引推到上maximums，然后按如下方式对其进行修剪： index 处的值maximums[i] 必须小于 index 处的值maximums[i-1]。如果不是，那么您继续在开始时将索引冒泡maximums，一次一个点，直到这成为真的。

实际上，最好将maximums数组视为环形缓冲区。修剪过程会将尾部向头部收缩，而弹出任何“过期”的最大值（当窗口滑过它们时）将使头部前进一步。

这有点笨拙，但这里有一些工作代码来说明：

#include <vector>
#include <iostream>

int main()
{
    const int window_size = 4;
    std::vector<int> vals = { 3, 7, 20, 6, 12, 2, 0, 99, 5, 16 };
    std::vector<int> maximums( window_size );
    int mhead = 0, mtail = 0;

    for( int i = 1; i < vals.size(); i ++ )
    {
        // Clean out expired maximum.
        if( maximums[mhead] + window_size <= i )
        {
            int next_mhead = (mhead + 1) % window_size;
            if( mtail == mhead ) mtail = next_mhead;
            mhead = next_mhead;
        }

        if( vals[i] >= vals[ maximums[mtail] ] )
        {
            // Replace and bubble up a new maximum value.
            maximums[mtail] = i;
            while( mhead != mtail && vals[ maximums[mtail] ] >= vals[ maximums[(mtail+window_size-1)%window_size] ] )
            {
                int prev_mtail = (mtail + window_size - 1) % window_size;
                maximums[prev_mtail] = maximums[mtail];
                mtail = prev_mtail;
            }
        }
        else
        {
            // Add a new non-maximum.
            mtail = (mtail + 1) % window_size;
            maximums[mtail] = i;
        }

        // Output current maximum.
        if( i >= window_size - 1 )
        {
            std::cout << vals[ maximums[mhead] ] << " ";
        }
    }

    std::cout << std::endl;
    return 0;
}

现在，时间复杂度...

最好的情况是O(n)，如果您的所有数据都已排序（升序或降序），就会发生这种情况。

我相信最坏的情况是O(2n)。在一次迭代中需要k个额外操作的唯一方法是，如果您已经有k个线性复杂度步骤（因此环形缓冲区已满）。在这种情况下，下一步的环形缓冲区将是空的。由于我们只能填充和清空环形缓冲区n/k次，因此这些偶尔的k操作会在kn/k或仅n出现。

您应该能够证明，即使环形缓冲区的持续部分清空也会导致相同的复杂性。

最后，我们可以总结并称整个事情为O(n)，因为任何常数因子对于大n变得无关紧要。它实际上比我预期的要好。=)

c++ - C ++：在子数组的数组中查找最大整数

1 回答 1

Related

Reference