我是论坛的新手,希望你能帮助我解决我的问题。最近,我开发了一个应用程序,其中我使用了 CUDA 流,目的是重叠计算和数据传输。我已经在 GPU Nvidia(Maxwell 架构)上执行了这个应用程序。我使用 Visual Profiler 工具观察到一些数据传输 HostToDevice 同时发生。Maxwell GPU 只有 2 个复制引擎。一个复制引擎用于 HostToDevice 传输,另一个复制引擎用于 DeviceToHost 传输,对吧?考虑到这一点,我认为两个 HostToDevice 传输不能同时发生。但是,我使用 Visual Profiler 观察到此行为出现在我的应用程序中。所以,我的问题是:在这个架构中,
太感谢了。