1

我正在使用以下代码来测试 CUDA NPP min-max 函数。

#include <string.h>
#include <fstream>
#include <iostream>

#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <string>
#include <math.h>
#include <assert.h>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include "cuComplex.h"
#include <cufft.h>

#include <cuda_runtime.h>
#include <npp.h>

#define Nz 256
#define Ny 280

int main(int argc, char** argv) {
    struct cudaDeviceProp p;
    cudaGetDeviceProperties(&p, 0);
    printf("Device Name: %s\n", p.name);
    
    Npp32f* d_img;
    cudaMalloc((void**)&d_img, Nz*Ny * sizeof(Npp32f));
    nppsSet_32f(1.0f, d_img, Nz*Ny);

    int BufferSize;
    Npp32f Max;
    Npp32f Min;
    nppsMinMaxGetBufferSize_32f(Nz*Ny,&BufferSize);
    
    Npp8u *pScratch;
    cudaMalloc((void **)(&pScratch), BufferSize);
    nppsMinMax_32f(d_img,Nz*Ny,&Min,&Max,pScratch);
    printf("Max:%g, Min:%g\n", (float)Max, (float)Min);
    
    cudaFree(d_img);
    cudaFree(pScratch);
}

设备数组中的所有元素都设置为 1,但我得到以下输出。

Max:1.12104e-44, Min:0
4

1 回答 1

2

关于NPP 文档Min并且Max必须存储在设备内存中(或至少可从设备访问),而不是像代码中那样存储在主机内存中。解决这个问题的方法是分配一些内存来存储最小/最大值,然后将值传输回主机以像文档示例中那样打印它们。

于 2021-08-21T13:59:07.320 回答