1

有谁知道有关分配给内存区域的内存一致性模型保证的文档cudaHostAlloc(..., cudaHostAllocMapped)?例如,当来自设备的写入对来自主机的读取变得可见时(可能是在内核完成之后,在内核执行期间的最早可能时间等)。

4

1 回答 1

2

在执行线程执行调用后,来自设备的写入保证在主机(或对等设备)上可见__threadfence_system()(仅在计算能力 2.0 或更高版本上可用)。
它们在内核完成后也可见,即在编程指南的“显式同步”部分中cudaDeviceSynchronize()列出的其他同步方法之一或之后成功完成。

当使用它的内核正在或可能正在运行时,不应从主机修改映射的内存,因为 CUDA 目前不提供任何同步方式。

于 2013-04-05T17:05:24.327 回答