我正在从事 CFD 项目,并且正在使用新的 CUDA 5 库“cusparse”来求解线性方程组。我测试了示例代码“conjugateGradientPrecond”。结果表明,使用 ILU 的预处理梯度比没有预处理的共轭梯度花费更多的时间来获得最终答案。前一种算法确实需要较少的迭代,但在“cusparseScsrsv_solve”上需要很多时间,因此整体时间较长。
这是我的问题,是否有任何其他预处理共轭梯度可以大大减少迭代,同时不包括任何耗时的函数,如“cusparseScsrsv_solve”?