我有这个非常简单的代码,并且 nvcc 需要很长时间才能编译(它会 100% 加载我的两个 CPU 内核并且永不停止)。这是由于一些循环展开吗?有没有更简单的方法来更快地初始化本地内存?
#include "cuda_runtime.h"
#include <stdio.h>
#include "cuComplex.h"
__global__ void test()
{
cuComplex myPoints[20][20];
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
myPoints[i][j].x=0.0;
myPoints[i][j].y=0.0;
}
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
printf("%d %d",myPoints[i][j].x,myPoints[i][j].y);
}
}
main()
{
}