1

我需要你的一些建议,我希望它不会占用你很多时间。

所以这是我的问题:我有一个小的方形密集矩阵,可能大小为 4x4、8x8、16x16,我想使用 CUDA 对其进行逆运算。

问题的特殊部分是我有 1024 个空闲 cuda 线程来执行此任务。所以我怀疑像 Gauss Jordan 这样最普遍的逆向方法在这里不能正常工作,因为它们稍微平行,并且只会使用大量 1024 中的大约 4-16 个线程。

但是我还能如何使用所有可用线程来反转这个矩阵呢?

感谢您的关注!

4

1 回答 1

1

对于此类问题,至少有两种可能的现成选项:

  1. 使用最新版本的 CUBLAS 库中附带的批处理求解器
  2. 使用 NVIDIA 分发给注册开发人员的 BSD 许可的 Gauss-Jordan 消除设备代码功能。这些旨在使用每个矩阵一个线程来反转小矩阵

[此答案是从评论中收集的,并作为社区 wiki 条目添加,以将问题从未回答队列中删除]

于 2015-10-25T06:21:51.980 回答