问题标签 [cusp-library]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - CUSP 内核代码
我想知道是否可以在 CUSP 库中找到 spmv 和转换的内核代码。我扫描了整个图书馆,但找不到。那是专有的还是类似的东西?
cuda - 从 COO 转换为压缩稀疏矩阵
我希望最好从矩阵市场为我的 OpenCL 库提供 CSR 文件,我在 C 语言中搜索了很多 CSR 生成器,但没有得到任何东西。我发现矩阵市场格式很舒服,因为它们定义了读写功能。我也很好奇 CUDA C 中的 CUSP 库如何能够从 .mtx 文件中读取 COO 矩阵并将其转换为 CSR 格式。提前致谢
c++ - CUDA 上的稀疏矩阵运算
我致力于将大型 Matlab 代码转换为 C++ 和 CUDA。我在转换一些稀疏矩阵运算时遇到问题,例如:
我能够使用 CUSPARSE 解决 2,使用 CUSP 解决 3,但是我无法使用 CUSP(或 CUSPARSE)进行元素矩阵乘法或问题 1。
如果有一个实现上述所有操作的 CUDA 库(最好是开源的),我很感兴趣。
cuda - 在 CUSP 或 cuSPARSE 中读取 mxArray
我正在尝试将 mxArray 从 matlab 读取到我定制的 .cu 文件中。我有两个稀疏矩阵要操作。我如何在尖点稀疏矩阵中读取它们,比如 A 和 B(或在 cuSPARSE 矩阵中),以便我可以执行操作并将它们返回给 matlab。我可以想出的一个想法是将 mxArrays 写入 .mtx 文件,然后从中读取。但同样,还有其他选择吗?
此外,我正在尝试使用其网站上发布的示例来了解各种 CUSP 机制。但是每次我尝试编译和运行示例时,都会出现以下错误。
这是我正在使用的机器上安装的东西。
我在我的机器上使用带有 Linux x86_64 的 GTX 480。奇怪的是,设备查询的代码也返回了这个输出。
我更新了我的驱动程序和 SDK 几天。不知道出了什么问题。
我知道,我在一个问题上问了很多问题,但是我在很长一段时间内都面临着这个问题,升级和降级驱动程序似乎并没有解决。
干杯
c++ - 不可能在 device_memory 中创建 cusp::coo_matrix 的推力::host_vector?
我正在尝试制作一个向量,cusp::coo_matrix
但似乎无法thrust::host_vector
以这种方式使用。考虑这段代码:
我从以下位置收到此错误消息nvcc
:
有趣的是,我得到了完全相同的错误cusp::host_memory
(嗯,几乎相同):
所以,我的问题是,这真的是一个缺点还是我做错了什么?非常感谢任何帮助。
另外,我已经测试了,std::vector
而不是thrust::host_vector
它工作正常。并不是说我是 Thrust 库的忠实粉丝,但我只是好奇。此外,我需要重写一些代码以防thrust::host_vector
不合适(thrust::find
并且使用了一些其他功能)。
另外,还有其他制作尖点矩阵数组的方法吗?我不认为原始指针new/delete
比 更好std::vector
,对吗?
cuda - 在推力指针中包装一个尖点稀疏矩阵变量
我正在使用 cusp 进行稀疏矩阵乘法。从结果矩阵中,我需要最大值而不将矩阵从设备内存复制到主机内存。我打算将结果矩阵包装在推力设备指针中,然后使用函数推力::max_element来获取最大元素。矩阵采用 coo 格式。如果 C 是结果稀疏矩阵,则
C.row_indices[]:包含行号
C.column_indices[]:包含列号
C.values[]:包含实际值
所以基本上我需要 C.values 数组中的最高值。
使用
给出错误
我如何包装我的结果矩阵以便在推力库中使用它?
cuda - CUDA 中的稀疏 Cholesky 分解
随着 CUDA 编程模型的成熟,我想知道是否有人知道在 NVIDIA GPU 上实现稀疏 Cholesky 分解的任何可用研究代码或开源库。
2012 年 5 月,我被 V. Volkov 指出了以下文献
[1] Christen 等人,2007 年使用 NVIDIA CUDA 技术平台的通用稀疏矩阵构建块,http://www.cs.jhu.edu/~misha/ReadingSeminar/Papers/Christen07.pdf
[2] Krawezik 和 Poole,2009 年,使用 GPU 加速 ANSYS 直接稀疏求解器,http ://saahpc.ncsa.illinois.edu/09/papers/Krawezik_paper.pdf
[3] Yu et al., 2011, A CPU-GPU hybrid approach for the unsymmetric multifrontal method, http://www.sciencedirect.com/science/article/pii/S0167819111001293
[4] George 等人,2011 年,GPU 上稀疏 SPD 矩阵的多正面分解,http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber= 6012808
[5] Lucas 等人,2012 年,图形处理单元上的多前沿稀疏矩阵分解,ftp ://ftp.isi.edu/isi-pubs/tr-677.pdf