2

NVIDIA CUDA 的 CUBLAS 库允许找到具有最大绝对值(cublasIsamax) 的元素/索引。是否可以使用 CUBLAS 缩减函数以某种方式找到具有最大实际值的元素/索引?

[我使用的是 CUBLAS 3.2 版。]

编辑
约束:我无法以任何方式更改生产服务器的状态。这意味着我不能使用推力/cudpp,并且我坚持使用旧版本的 CUBLAS。

4

1 回答 1

3

我不确定您指的是什么“减少功能”。

CUBLAS 基本上只是用于 CUDA 设备的 BLAS 的“同类”实现。它仅提供标准的 1 级、2 级和 3 级 BLAS 函数,以及恰好三个扩展——geam(缩放矩阵加法/转置)、dgmm(对角矩阵-矩阵点积)和 getrfBatched(用于许多小矩阵的批量 LU 分解)。这些函数都不会找到提供的向量或矩阵的有符号最大值。

NVIDIA提供 cudpp推力,其中任何一个都可能更适合此类操作。此外,CUBLAS 3.2 已有两年半的历史。

作为最后的评论,我强烈建议使用 CUBLAS 4.x 或 CUBLAS 5.x 版本。代码的 API 和性能得到了显着改善,尤其是对于较新的硬件。

于 2013-03-13T12:06:18.143 回答