我想使用 CHOLMOD 的 GPU 加速,并找到了几个关于如何使用库进行 Cholesky 分解的简单示例。然而,所有示例都在主机内存中向 CHOLMOD 提供了矩阵,并允许它将它们复制到设备中。我正在处理的项目已经将这些矩阵驻留在设备内存中,因为它们是并行构建的,并且在执行 Cholesky 分解后将在 GPU 上执行更多处理。
我的问题是:是否可以将 CHOLMOD 直接与设备内存接口?为了避免复制到主机内存,只是让 CHOLMOD 将其复制回设备?
抱歉,如果这不是问这个问题的正确地方,如果有人可以将我指向一个用户论坛,那也很棒。