我有一个简单的内核,我正在使用clock()
. 我在如何测量 NVIDIA CUDA 中的内核时间?
所以我已经使用
clock_t start = clock();
(并且同样停止)来计时。在编译时,我收到以下错误:
tex1.cu(14):错误:明显调用括号前的表达式必须具有(指向)函数类型`
我是否缺少头文件或编译器选项?
另外,我尝试使用 CUDA 计时器(cudaEvent_t start, stop;
),但我得到的经过时间是 0 毫秒。我创建开始和停止,记录开始,做一些 CUDA 的东西,同步,记录停止,事件同步和测量经过的时间。这部分编译得很好,但让我经过的时间为零。
这是一个简单的内核,我用它来测试我对纹理内存的理解。内核:
__global__ void magic(float *mean, int *clock){
int i, tid = threadIdx.x + blockIdx.x * blockDim.x;
float t, sum=0.0;
clock_t start = clock();
if ( tid < dimy )
{
for(i=0;i<dimx; i++){
t = tex2D( input, i, tid );
sum = sum + t*t;
}
clock_t stop = clock();
clock[tid] = (int)(stop-start);
}
}