我有一个问题:快速线性系统求解(我有很多这样的系统)。我将使用 GPU 和 OpenCL 解决它。
我喜欢动态语言,例如 Ruby 或 Python,并且我已经摆脱了使用 C 等低级语言的习惯。
所以我有两个同时的目标:
- 开发这样的 OpenCL 解决方案,以尽可能少的努力尽可能快地求解线性系统。
- 不要在性能上损失太多。我不想为了方便而支付 2-10 倍的减速,但我准备为使用高级语言的工作支付 30-50%。
对我来说最好的情况是:几乎在 OpenCL C 中编译 python 代码几乎没有浪费。
我找到了这样的解决方案:pure OpenCL C、PyOpenCL、Clyther。
我应该从什么开始?