问题标签 [cula]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
74 浏览

cuda - CUDA lapack 库(CULA 和 MAGMA)作为设备功能

对 CUDA(CULA 或 MAGMA)中的 lapack 例程的调用是否可以在 CUDA 内核中而不是从主机中实例化?(__device 函数而不是 __global 函数)如果不可能,那么如何在 CUDA 中实现(_device)线性代数例程?我的目标是在 CUDA 中并行运行一些 Lapack 函数(sgesvd、sgesv..),并且我的应用程序中的调用必须从设备而不是主机进行。

0 投票
1 回答
121 浏览

python - CULA - 在 CULA 中使用 Python solve()

如何将 Python 的 solve() 合并到 Python CULA 程序中?我在用

结果:

liculaC 和 ctypes 的任何组合都会给我类似的错误。我怎样才能把这个功能带进来?我是否需要使用 C 函数(scanf)或其他东西。谢谢。

0 投票
0 回答
99 浏览

python - Python CULA Sgesv Ax=B 解决但对正数给出负数?为什么?

我正在使用 Python CULA Sgesv 来求解矩阵运算。当我将 CULA 的答案与线性代数解决方案进行比较时,CULA 会返回正确的数字,但会反转数字的符号。因此,如果真正的解决方案是正的,那么 CULA 解决方案是负的。我已经尝试过 float32 (SGESV) 和 doubles (DGESV) 并且都产生了相同的结果。我不知道我做错了什么。

0 投票
1 回答
675 浏览

python - Theano:混合 CPU 和 GPU?

我构建了一个神经网络,它需要使用 Cholesky 分解和求解三角系统作为其计算的一部分。当然,这意味着我还需要计算整个计算的梯度。

当我尝试编译代码时,我收到错误“没有可用的 Cula”。不幸的是,我无法从网站下载 Cula 。

我想知道是否可以将 CPU 和 GPU 与 theano 混合使用。我需要使用 Cholesky 和 ​​Solve 的矩阵很小 (100x100),所以我可以在 CPU 上完成这部分。不过,要做到这一点,我需要在 GPU 计算完矩阵后立即将它们传输到 CPU,然后将结果发送回 GPU。是否有可能足够透明地做到这一点?

0 投票
0 回答
31 浏览

cula - Cula 例程 sgbtrf 未定义

当我尝试调用 CULA 例程时,GBTRF我得到此错误标识符“culaSgbtrf”未定义,但其他所有内容(inizializaion、GetErrorInfoStrin 等)似乎都可以正常工作。有人知道为什么并且可以帮助我吗?

0 投票
0 回答
73 浏览

c++ - 在 C++ 中使用 CUBLAS 逆方阵

谁能告诉我在 C++ 中使用 CUBLAS 找到方阵逆矩阵的方法吗?如果您可以提供一个带有 2x2 矩阵的简单示例代码,那将非常有帮助。

0 投票
1 回答
68 浏览

c++ - 使用 cublasSgetriBatched 在 gpu 上求逆两个矩阵

我是cublas的新手。我想在 GPU 上并行计算两个矩阵的逆。矩阵是 [4 8;3 9] 和 [5 2;1 7]。是否可以使用 cublasSgetriBatched 来做到这一点?这是我的代码,我得到的结果不正确。在这里,我采用了 2x2 矩阵,但我想找到一种方法来解决多个 mxm 矩阵的这个问题。