问题标签 [cusolver]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
47 浏览

cuda - 使用 CUDA 的矩阵的多个 SVD

我正在尝试使用下面给出的代码进行 SVD,但是我没有得到 d_S 的正确结果,当 num_Matrices > 128 时,比如说 256,当 num_Matrices = 128*128 时我得到正确的结果,我指的是基于对堆栈溢出问题的回答,链接是Parallel implementation for multiple SVDs using CUDA

下面给出了我的代码,它给出了前 26 个矩阵的奇异值作为全 0。

0 投票
1 回答
33 浏览

c++ - 尝试运行 CusolverSSgels 测试用例,但它不起作用

我正忙于研究 LS 方法,我手动实现了一个共轭梯度求解器,但是在更新我的 CUDA 版本后,我看到有一个新函数(cusolverDnSSgels),我认为它比我的手动实现要快。我的第一个任务是尝试在测试用例上运行它(见下文),我希望结果是:-6.5, 9.7根据 MA​​Tlab。不幸的是我找不到我做错了什么,我也找不到一个例子,因为它是一个相对较新的功能。

输出表明niter= -3,根据文档,这将表明迭代次数过多,但这没有意义,因为它是一个非常小的矩阵,应该很容易解决。

我得到的结果是:

有人可以指出我做错了什么吗?

0 投票
0 回答
28 浏览

java - 为什么在 Cusolver 中每隔一个函数调用才计算特征向量?

我正在编写一个程序来比较 JBlas 和 JCublas 的速度。当我第一次调用以下函数时,一切正常,并且 v 包含正确的特征向量。当我第二次调用它时,计算时间要少得多,但只返回输入的对称矩阵a,就好像d_A的值从未改变一样。

该函数似乎只在奇数调用上按预期工作。我有一种预感,这个错误是由于 GPU 内存中的某些东西没有被正确清除,但我找不到它。

0 投票
1 回答
49 浏览

c++ - 使用 cusolverDnDpotrfBatched 得到不正确的结果

我想使用 cusolverDnDpotrfBatched 找到 3x3 矩阵的 Cholesky 分解,但我没有得到应该存在于下三角矩阵中的零。这是我要计算cholesky分解的矩阵[1 2 3; 2 5 5; 3 5 12]。应该是这样吗?我错过了什么?我知道这篇 用 CUDA 进行 Cholesky 分解的帖子。这 是我的代码:

0 投票
1 回答
71 浏览

c++ - 使用 CuSolver 进行 Hermitian 矩阵的特征分解与 matlab 的结果不匹配

我从这里遵循特征分解的例子, https://github.com/NVIDIA/CUDALibrarySamples/blob/master/cuSOLVER/syevd/cusolver_syevd_example.cu

我需要为 Hermatian 复数矩阵做这件事。问题是特征向量与 Matlab 结果的结果完全不匹配。

有谁知道为什么会发生这种不匹配?

我还尝试了 cusolverdn svd 方法来获取特征值和给出另一个结果的向量。

为了方便起见,我的代码在这里,

我在他们的 git ( https://github.com/NVIDIA/CUDALibrarySamples/issues/58 ) 中提出了这个问题,但不幸的是没有人回答。

如果有人可以帮助我解决这个问题,那将非常有帮助。