我需要你的一些建议,我希望它不会占用你很多时间。
所以这是我的问题:我有一个小的方形密集矩阵,可能大小为 4x4、8x8、16x16,我想使用 CUDA 对其进行逆运算。
问题的特殊部分是我有 1024 个空闲 cuda 线程来执行此任务。所以我怀疑像 Gauss Jordan 这样最普遍的逆向方法在这里不能正常工作,因为它们稍微平行,并且只会使用大量 1024 中的大约 4-16 个线程。
但是我还能如何使用所有可用线程来反转这个矩阵呢?
感谢您的关注!
我需要你的一些建议,我希望它不会占用你很多时间。
所以这是我的问题:我有一个小的方形密集矩阵,可能大小为 4x4、8x8、16x16,我想使用 CUDA 对其进行逆运算。
问题的特殊部分是我有 1024 个空闲 cuda 线程来执行此任务。所以我怀疑像 Gauss Jordan 这样最普遍的逆向方法在这里不能正常工作,因为它们稍微平行,并且只会使用大量 1024 中的大约 4-16 个线程。
但是我还能如何使用所有可用线程来反转这个矩阵呢?
感谢您的关注!