虽然我的程序编译没有错误,但我运行我的程序,并且我的初始 C 语句工作,但是当我点击我的第一个 CUDA 函数cudaMallocHost()
时,程序停止执行任何操作。我没有收到任何错误,我必须使用 cntr-c 手动退出。我尝试删除各个部分,似乎每当我点击我的任何 CUDA 函数时,它都有相同的效果。
我包括cuda.h
and cuda_runtime.h
,并且正在编译一个安装了 NVIDIA SDK 和 CUDA 5.5的.cu
文件。nvcc
int main(){
int set[6][6] = {{1,2,3,4,5,6}, {7,8,9,10,11,12}, {13,14,15,16,17,18}, {19,20,21,22,23,24}, {25,26,27,28,29,30}, {31,32,33,34,35,36}};
int *i=0, *d_d=0, a, b, nbytes;
int size = sizeof(set[0]);
nbytes = size*size*sizeof(int);
for(a=0;a<6;a++){
for(b=0;b<6;b++){
printf("%d, ", set[a][b]);
}
printf("\n");
}
/*end safezone*/
cudaMallocHost((void**)&set, nbytes);
memset(set,0,nbytes);
printf("CPUmem");
cudaMalloc((void**)&d_d, nbytes);
cudaMemset(set,0,nbytes);
printf("GPUmem");
cudaMemcpy(d_d, set, nbytes, cudaMemcpyHostToDevice);
dim3 threads = dim3(((size % 512) + 1), 1);
dim3 blocks = dim3((threads.x / 512) + 1, 1);
printf("Copied & DIM setup");
matrixflop<<<blocks, threads>>>(set);
printf("Threads created");
cudaMemcpy(set, d_d, nbytes, cudaMemcpyDeviceToHost);
/*start safezone*/
for(a=0;a<6;a++){
for(b=0;b<6;b++){
printf("%d, ", set[a][b]);
}
printf("\n");
}
/*end safezone*/
cudaFreeHost(i);
cudaFree(d_d);
printf("Success");
getchar();
exit(EXIT_SUCCESS);
return 0;
}
编辑以包含代码。