问题标签 [cusp-library]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - 使用 cusp 库将 2 个稀疏矩阵相乘
我是使用 cusp 库进行 cuda 的新手。我正在尝试为 CUDA 实现修改后的单纯形算法。为此,我需要乘以 2 个稀疏矩阵来更新基本矩阵。
所以问题是 - 如何使用 cusp 库将 2 个稀疏矩阵相乘(以什么格式并不重要)?还有一种方法可以知道结果矩阵将包含多少个非零元素(出于内存分配目的)?
我试过了:
因为 cusp:multiply() 是我发现的唯一乘法函数。
尖头 v.0.4 CUDA v.5.5
c++ - 如何从尖点库矩阵格式中获取原始指针
我需要从尖点库矩阵格式中获取原始指针。例如:
如何获取指向 row_indices、column_indices 和 values 数组的原始指针?我需要将它们传递给我的内核,如果可能的话,我想避免不必要的数据复制。
cusp-library - CUSP 主机功能并行化与 openMP
CUSP 主机功能是否也与 openMP 并行实现?我有点困惑,因为在 github 讨论中它说“在 openMP 中添加了功能”,但是在尖端没有明确声明它是用 openMP 完全实现的。
c++ - CUSP 稀疏库给出奇怪的结果
我正在尝试在 CUSP 中执行以下操作:
这是
另一方面,我从 CUSP 得到了一个奇怪的答案
结果看起来像
最后一个看起来不太对劲。有人知道我在做什么错吗?我是否使用错误的代码或者我们应该有一个非常好的猜测解决方案+使用预处理器?
c++ - 使用带有 nvcc 和 CUSP 的 IFORT 未解决的引用
我有一个我正在编译的程序:
一切正常,直到我添加了 CUSP 支持,我有这个包装器(bicgstab.cu):
Nvcc 编译并生成对象,但是在最后一个命令中,当我将所有链接在一起时,由于链接出现了一堆错误:
我相信这是因为 ifort 正在添加或删除下划线、添加小写/大写或其他任何内容,因为文件正在编译写入,并且如果我在程序外部生成二进制文件,只是为了测试,它工作得很好。
非常感谢您!
cusp-library - 复数的 CUSP GMRES 错误
我正在尝试使用 CUSP 使用 GMRES 方法求解复杂矩阵。
编译时,我收到一条错误消息:“不存在从“cusp::complex”到“float”的合适转换函数”
如果我去看看错误来自哪里,它会给我 gmres.inl,第 143 行
resid 和 s 类型在哪里
当两者的类型都很复杂时,为什么它告诉我浮动?
code:` // 创建一个空的稀疏矩阵结构(CSR 格式) cusp::csr_matrix,cusp::device_memory>A;
visual-studio-2010 - VS2010 中 CUDA 的编译选项
我正在尝试使用我的 Visual Studio 2010 配置 CUDA6.0。我使用 CUDA 6.0 运行时创建了一个项目。编译时,我需要更改/添加任何选项吗?由于我的 CUDA 代码运行速度比系列版本慢,是否有可能不并行执行代码(例如,GPU 变成慢速 CPU ......),不管其他可能性,例如双精度、开销等?
非常感谢,XF
nvcc - 从 Fortran 调用的 CUSP 库不起作用
我想使用从 Fortran 调用的 CUSP 求解器重复求解 CG/BicGSTAB。为了避免传输,我将 Fortran 数据直接传递给 CUSP。代码编译但在运行时标记中断:
更不用说代码的核心了,连打印流都没有发生。代码当然是在初步阶段,但我想知道它有什么问题。
如果这不可行,我可以转向另一种方法,但由于我不确定正确性,我无法决定。任何帮助表示赞赏。
cuda - cuSPARSE 乘法函数输出不正确的值
我正在尝试使用 cuSPARSE 库实现稀疏矩阵乘法。我已经使用了文档中的大部分代码,即来自这里。即使我得到了正确的行指针、输出的列指针,我得到的输出值也不正确。
我遵循了以下步骤: 1. 生成 coo 格式矩阵。2. 将其转换为 csr 格式 3. 找到非零元素向量以及输出矩阵中非零元素的数量 4. 执行矩阵乘法 5. 打印结果
除了输出矩阵值之外,我得到了正确的结果(行指针、列指针是正确的)——同样可以通过执行下面的代码来打印。我知道我错过了一些简单的东西,但我无法弄清楚。请让我知道出了什么问题以及如何纠正。
cuda - 使用 CUSP 打印矩阵的 csr 格式
我正在尝试使用 CUSP 和 CUDA 将稀疏矩阵转换为 csr 格式。我稍微修改了 CUSP 文档中显示的代码:
但我得到的结果是 coo 格式的矩阵,索引移动了 1:
有什么帮助吗?
谢谢。