AccelerEyes 于 2012 年 12 月宣布它在 GPU 代码上与 Mathworks 合作,并已停止其产品 Jacket for MATLAB:
http://blog.accelereyes.com/blog/2012/12/12/exciting-updates-from-accelereyes/
不幸的是,他们不再出售夹克许可证。
据我了解,基于 ArrayFire 的 Jacket GPU Array 解决方案比 MATLAB 提供的 gpuArray 解决方案要快得多。
我开始使用 gpuArray,但我发现很多功能都实现得很差。例如一个简单的
myArray(:) = 0
很慢。我已经编写了一些自定义的 CUDA-Kernels,但是即使在整个代码中始终使用 gpuArrays,实现不佳的标准 MATLAB 功能也会增加很多开销。我通过用手写的 CUDA 代码替换 MATLAB 代码解决了一些问题 - 但我不想重新实现 MATLAB 标准功能。
我缺少的另一个功能是稀疏 GPU 矩阵。
所以我的问题是:
如何加速 MATLAB 提供的糟糕实现的默认 GPU 实现?特别是,如何使用 GPU 加速 MATLAB 中的稀疏矩阵运算?