该问题类似于在 M x N 图像上应用滑动 2D 窗口最大滤波器。然而,与正常情况相比,滑动窗口不是简单地滑动超过 1 个像素,而是通过 k 像素跳跃。因此,例如,如果 k = 2,则滑动窗口将水平应用于 (0,0)、(2,0)、(4,0)、... 处的像素,同样垂直应用。
对于 1 跳的情况,CUDA NPP(性能原语)库中已经有一个现有的实现。更具体地说,这些函数被称为nppiFilterMax*
。但是,我还没有找到更通用的 k-hop 滑动版本。作为一种解决方法,我可以简单地使用 NPP 函数来执行 1-hop filter max 并简单地在相应的位置选择结果,尽管这看起来既浪费又低效。这个问题是否有任何现有的实现或白皮书?