cudaMalloc()
对同步 cuda 函数(例如,cudaBindTextureToArray()
等)的调用是否会阻塞主机,直到设备上所有先前请求的任务都完成?或者它只会阻塞直到对该同步函数的调用完成?
换句话说,对同步 cuda 函数的调用是否与cudaDeviceSynchronize()
?
cudaMalloc()
对同步 cuda 函数(例如,cudaBindTextureToArray()
等)的调用是否会阻塞主机,直到设备上所有先前请求的任务都完成?或者它只会阻塞直到对该同步函数的调用完成?
换句话说,对同步 cuda 函数的调用是否与cudaDeviceSynchronize()
?