我正在寻找一种方法来找到矩阵的伪逆,以便可以在 GPU 上完成。SVD/QR 难以并行化且不受 MATLAB 的 GPU 支持,但似乎 LU 虽然可以并行运行,但 MATLAB 的 GPU 也不支持。我比较了性能,它似乎比在单核 CPU 上运行要慢。
我正在寻找可以使用的伪逆(甚至是方阵的正则逆)。根据 Matlab,使用 mldivide () 执行适用于 GPU 的高斯消除。
我尝试使用 A\I,但不幸的是它不能在 GPU 上高效运行。
有没有人可以指导我为并行 LU 或高斯消除优化代码?
我听说过 MAGMA 包,但安装和编译似乎需要做很多工作,我真的需要这个简单的东西。
也欢迎使用 C++ 代码。
谢谢,吉尔