0

调用内核函数和同步时,延迟有何不同,延迟的近似值是多少 - 等待其完成:

  • 当从 GPU 调用时 - 从其他内核函数使用动态并行:kernel_function<<<>>>>(); cudaDeviceSynchronize();
  • 从 CPU 主机调用时:kernel_function<<<>>>>(); cudaDeviceSynchronize();
4

1 回答 1

2

CUDA 文档中没有指定延迟,并且可能会根据您正在运行的实际内核、您传递给内核的实际参数安排以及您正在使用的操作系统和驱动程序配置而有很大差异。

您需要运行自己的测试来发现特定情况下的延迟。

于 2013-10-19T14:54:29.707 回答