上述函数如何在 cuda 中执行操作。我们是否需要连同此一起编写 CudaMalloc() 或 MemCopy() 或者只是在内部调用来完成所有这些。
我写
nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);
这里 'in' 是具有输入图像的向量,而 'out' 是一个空向量。但是执行上述函数后,输出向量仍然是 '0' 。你能指导我如何调整函数的大小吗?