0

我需要用 cuda 计算矩阵(双精度数组)的行列式,我想使用 LU 分解来做到这一点。我没有找到设备功能,cusolverSp.h只有主机功能cusolverSpDcsrlsvluHost。我查看 cuda 7.0 和 cuda 7.5。

我不明白为什么我找不到它,因为它在官方文档中有所描述:http: //docs.nvidia.com/cuda/cusolver/index.html#api

设备上的 Cholesky 分解等其他功能也有效。

实施了吗?如果是,我在哪里可以找到它?

感谢您的帮助!

4

1 回答 1

1

查看您指出的文档,我看到:

备注5:仅提供CPU(Host)路径

页面上的一些阅读给出了这一点:

接下来,cuSolverSP 提供了一组基于稀疏 QR 分解的新稀疏例程。并非所有矩阵在分解中都具有良好的并行性稀疏模式,因此 cuSolverSP 库还提供了一个 CPU 路径来处理那些类似序列的矩阵。对于那些具有丰富并行性的矩阵,GPU 路径将提供更高的性能。该库旨在从 C 和 C++ 调用。

结合这两个引号,我猜设备功能不值得提供……但这只是我的解释。

于 2015-08-27T10:33:41.840 回答