我正在使用以下代码来计算 C++ coce 中的时间
SYSTEMTIME sm;
FILETIME fm;
GetSystemTime(&sm);
SystemTimeToFileTime(&sm,&fm);
*time = (double)(fm.dwLowDateTime / 10000000.0);
现在我想计算当我实现 CUDA 版本时,这个函数在 CUDA 内核函数之间被调用。任何想法或帮助我如何做到这一点。我对 cuda 编程很陌生,对它了解不多。也有人能告诉我如何在__device__
我尝试过的函数中使用 new 运算符
maxY = new int[m_imgWidth*m_imgHeight];
cudaMalloc((void **)&m_labelBuf , m_imgWidth*m_imgHeight);
但它给了我错误
calling a __host__ function("cudaMalloc") from a __global__ function("kernel_Labeling") is not allowed