我想以这种方式启动内核:
kernel_code<<<NUMBER_BLOCKS, NUMBER_THREADS_PER_BLOCK>>> (param1, param2, param3, param4);
因此,仅使用网格的 x 维。我想用尽可能多的块来调用内核。我以为最大。一维网格中的块数为 65535。
但是,我探索了CU_DEVICE_ATTRIBUTE_MAX_GRID_DIM_X
听起来与我想找出的数字完全相同的常数。然而,这个常数在我的 GeForce 210 (CUDA 1.2) 上返回 1899336。我怎么了?