为可以在大型网格中执行的任务调用两个内核是否有区别
1.
for(int i=0;i<2;i++)
{
dim3 dimBlock(16, 8);
dim3 dimGrid(1,1);
FooTask<<dimGrid,dimBlock>>>(MatrixA,MatrixB)
}
2.
dim3 dimBlock(16, 16);
dim3 dimGrid(1,1);
FooTask<<dimGrid,dimBlock>>>(MatrixA,MatrixB)
在 Gpu 上创建内核是否有成本。