0

根据CUDA 流不重叠,“分析器将序列化流以获取准确的时序数据”。现在的问题是,是否有办法避免在 cuda 分析(比如 nvvp)中出现这种序列化行为?我正在使用 Fermin M2090 和 cuda-4.0。

4

1 回答 1

3

Visual Profiler 5.0(包括 nvprof 和 CUPTI)和 Nsight Visual Studio Edition 2.0 及更高版本(>2 年)支持 Fermi 和 Kepler 设备的并发内核跟踪。

于 2013-01-23T00:45:49.033 回答