0

对 CUDA(CULA 或 MAGMA)中的 lapack 例程的调用是否可以在 CUDA 内核中而不是从主机中实例化?(__device 函数而不是 __global 函数)如果不可能,那么如何在 CUDA 中实现(_device)线性代数例程?我的目标是在 CUDA 中并行运行一些 Lapack 函数(sgesvd、sgesv..),并且我的应用程序中的调用必须从设备而不是主机进行。

4

0 回答 0