Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
cudaatomicMin操作似乎只能找到设备内存主干的最小值。但是,无论如何要找到哪个块/线程最终找到这个最小值?我有计算 2.0。
atomicMin
如果atomicMin对 32 位值进行操作,可以对 64 位值使用广义原子操作,其中 32 位表示最小化值,32 位表示线程的全局索引。此处概述了一种通用方法。
atomicMin由于 cc 3.5 设备仅支持64 位,因此我假设您正在找到 32 位最小值。
如果您使用 64 位值,则可以使用并行归约技术在归约过程中同时携带最小(或最大值)值和索引。 此问题/答案演示了一种并行归约方法,该方法可以找到矩阵的每行的最大值和索引。