5

在 LAPACK 中有这个函数用于对角化

  SUBROUTINE DSPGVX( ITYPE, JOBZ, RANGE, UPLO, N, AP, BP, VL, VU,
 $                   IL, IU, ABSTOL, M, W, Z, LDZ, WORK, IWORK,
 $                   IFAIL, INFO )

*

我正在寻找它的 GPU 实现。我正在尝试查找此功能是否已在 CUDA(或 OpenCL)中实现,但只找到了 CULA,它不是开源的。

因此,CUBLAS 存在,我想知道我怎么知道这个子例程的 BLAS 或 CUBLAS 等价物是否可用。

4

2 回答 2

12

BLAS 不包括特征值求解器,CUBLAS 在这方面也不例外。UTK 开发的Magma库包括几个 GPU 加速的特征值问题例程。我不认为 xSPGV 已实现,但其他几个已实现。根据矩阵的特性,可能会有一些你可以使用的东西。

于 2012-02-06T19:48:42.713 回答
2

MAGMA 包括源代码。仅限 CUDA + CPU(目前?)

“MAGMA 项目旨在开发一个类似于 LAPACK 的密集线性代数库,但适用于异构/混合架构,从当前的“多核+GPU”系统开始。”

http://icl.cs.utk.edu/magma/index.html

http://web.eecs.utk.edu/~luszczek/pubs/parcocudaopencl.pdf(OpenCL的 MAGMA 正在进行中)

编辑:当我搜索 OCL 的东西时,我偶然发现了这个库...... http://viennacl.sourceforge.net/ 我要仔细看看。(你可以从网站的风格看出它很好)

于 2012-02-07T11:25:49.487 回答