Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我实现了一个前置条件共轭梯度法,Ax = B通过使用CUBLASlib 和CUDA.
Ax = B
CUBLAS
CUDA
我的代码在处理40000x40000隐式矩阵时工作正常A。
40000x40000
A
但是,当我将大小增加到 时130000x130000,它会给出CUBLAS_STATUS_INTERNAL_ERRORfromcublasDdot方法。
130000x130000
CUBLAS_STATUS_INTERNAL_ERROR
cublasDdot
有谁知道为什么会发生这种情况以及如何解决它?
我解决了这个问题。实际上,这不是由CUBLAS API. 当我给求解器提供更大尺寸的矩阵时,求解它需要更长的时间。但是,时间超过了 GPU 看门狗限制,然后求解器被看门狗进程终止。因此,我们购买了一个新的 GPU 作为我们的专用 GPU,并解决了这个问题。@talonmies 感谢您的建议!
CUBLAS API