是否可以同时启动两个执行独立任务的内核。例如,如果我有这个 Cuda 代码
// host and device initialization
.......
.......
// launch kernel1
myMethod1 <<<.... >>> (params);
// launch kernel2
myMethod2 <<<.....>>> (params);
假设这些内核是独立的,是否有一种工具可以同时启动它们,为每个内核分配几个网格/块。CUDA/OpenCL 是否有此规定。