0

cudaatomicMin操作似乎只能找到设备内存主干的最小值。但是,无论如何要找到哪个块/线程最终找到这个最小值?我有计算 2.0。

4

1 回答 1

2

如果atomicMin对 32 位值进行操作,可以对 64 位值使用广义原子操作,其中 32 位表示最小化值,32 位表示线程的全局索引。此处概述了一种通用方法。

atomicMin由于 cc 3.5 设备仅支持64 位,因此我假设您正在找到 32 位最小值。

如果您使用 64 位值,则可以使用并行归约技术在归约过程中同时携带最小(或最大值)值和索引。 此问题/答案演示了一种并行归约方法,该方法可以找到矩阵的每行的最大值和索引。

于 2013-08-25T19:58:08.833 回答