Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
根据CUDA 流不重叠,“分析器将序列化流以获取准确的时序数据”。现在的问题是,是否有办法避免在 cuda 分析(比如 nvvp)中出现这种序列化行为?我正在使用 Fermin M2090 和 cuda-4.0。
Visual Profiler 5.0(包括 nvprof 和 CUPTI)和 Nsight Visual Studio Edition 2.0 及更高版本(>2 年)支持 Fermi 和 Kepler 设备的并发内核跟踪。