4

CUDA NPP 库支持使用 nppiFilter_8u_C1R 命令过滤图像,但不断出现错误。让 boxFilterNPP 示例代码启动并运行没有问题。

eStatusNPP = nppiFilterBox_8u_C1R(oDeviceSrc.data(), oDeviceSrc.pitch(), 
                                  oDeviceDst.data(), oDeviceDst.pitch(), 
                                  oSizeROI, oMaskSize, oAnchor);

但是,如果我将其更改为使用 nppiFilter_8u_C1R,eStatusNPP 将返回错误 -24 (NPP_TEXTURE_BIND_ERROR)。下面的代码是我对原始 boxFilterNPP 示例所做的更改。

NppiSize oMaskSize = {5,5};
npp::ImageCPU_32s_C1 hostKernel(5,5);

for(int x = 0 ; x < 5; x++){
    for(int y = 0 ; y < 5; y++){
        hostKernel.pixels(x,y)[0].x = 1;
    }
}

npp::ImageNPP_32s_C1 pKernel(hostKernel);

Npp32s nDivisor = 1;

eStatusNPP = nppiFilter_8u_C1R(oDeviceSrc.data(), oDeviceSrc.pitch(), 
                               oDeviceDst.data(), oDeviceDst.pitch(), 
                               oSizeROI, 
                               pKernel.data(),
                               oMaskSize, oAnchor,
                               nDivisor);

这已在 CUDA 4.2 和 5.0 上进行过尝试,结果相同。

当 oMaskSize = {1,1} 时,代码以预期结果运行

4

3 回答 3

7

过滤器应用向上和向左延伸的掩码,遵循两个函数之间的卷积反转第二个函数的方向的数学约定。

盒子过滤器面具向下和向右延伸,这可能更直观。

在任何情况下,问题都是由以下事实引起的:为了计算 DESTINATION[0, 0],必须在有效的 SOURCE[-4, -4) 处对更改代码中的输入图像进行采样。由于输入图像是通过纹理采样器访问的,因此将源图像指针偏移量绑定 (-4, -4) 会导致您看到的纹理绑定错误。

解决方法:此问题最简单的解决方法是将锚点设置为 (4, 4),这将有效地向下和向右移动遮罩。您仍然需要注意您希望反转内核数组中的权重(即K[-4, -4] -> K[0, 0],K[0, 0] -> K[-4, -4]等)。

于 2012-10-09T00:48:08.410 回答
3

当我将内核存储为ImageCPU/时,我遇到了同样的问题ImageNPP

一个好的解决方案是将内核作为传统的一维数组存储在设备上。我试过这个,它给了我很好的结果(没有那些不可预测或垃圾图像)。

感谢 Frank Jargstorff 在这篇 StackOverflow 帖子中提出的 1D 想法。

NppiSize oMaskSize = {5,5};
Npp32s hostKernel[5*5];

for(int x = 0 ; x < 5; x++){
    for(int y = 0 ; y < 5; y++){
        hostKernel[x*5+y] = 1;
    }
}

Npp32s* pKernel; //just a regular 1D array on the GPU
cudaMalloc((void**)&pKernel, 5 * 5 * sizeof(Npp32s));
cudaMemcpy(pKernel, hostKernel, 5 * 5 * sizeof(Npp32s), cudaMemcpyHostToDevice);

使用这个原始图像,这是我从您的代码中使用 1D 内核数组得到的模糊结果: 在此处输入图像描述

我使用的其他参数:

Npp32s nDivisor = 25;
NppiPoint oAnchor = {4, 4};
于 2012-10-16T05:24:34.107 回答
1

感谢您的帮助。克服了错误,但我看到了一些奇怪的行为。图像会根据我之前运行的程序而变化,并且图像不会显示我要做什么。

我试图模仿的例子是使用 nppiFilter_8u_C1R 的 nppiFilterBox_8u_C1R,我将内核设置为 1,将 nDivisor 设置为内核的总和。

此代码仍然是对 boxFilterNPP 示例代码的修改。

NppiSize oMaskSize = {5,5};
npp::ImageCPU_32s_C1 hostKernel(5,5);
for(int x = 0 ; x < 5; x++){
    for(int y = 0 ; y < 5; y++){
        hostKernel.pixels(x,y)[0].x = 1;
    }
}

npp::ImageNPP_32s_C1 pKernel(hostKernel);
Npp32s nDivisor = 25;
NppiPoint oAnchor = {4, 4};
eStatusNPP = nppiFilter_8u_C1R(oDeviceSrc.data(),oDeviceSrc.pitch(), 
                               oDeviceDst.data(), oDeviceDst.pitch(), 
                               oSizeROI, 
                               pKernel.data(),
                               oMaskSize, oAnchor,
                               nDivisor);

由于内核只是一个,因此需要反转权重应该不是问题。

此代码返回的 5 种不同类型的图像如下所示。大多是最后一个被退回。

http://1ordrup.dk/kasper/image/Lena_boxFilter1.jpg
http://1ordrup.dk/kasper/image/Lena_boxFilter2.jpg
http://1ordrup.dk/kasper/image/Lena_boxFilter3.jpg
http://1ordrup.dk/kasper/image/Lena_boxFilter4.jpg 
http://1ordrup.dk/kasper/image/Lena_boxFilter5.jpg

我认为发生这种情况的原因是内核未正确初始化或未使用,因此具有伪随机内容的数据用于内核。

于 2012-10-09T12:12:38.817 回答