我是使用 cusp 库进行 cuda 的新手。我正在尝试为 CUDA 实现修改后的单纯形算法。为此,我需要乘以 2 个稀疏矩阵来更新基本矩阵。
所以问题是 - 如何使用 cusp 库将 2 个稀疏矩阵相乘(以什么格式并不重要)?还有一种方法可以知道结果矩阵将包含多少个非零元素(出于内存分配目的)?
我试过了:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdlib.h>
#include <stdio.h>
#include "cusparse.h"
#include <cusp/version.h>
#include <cusp/multiply.h>
#include <cusp/array2d.h>
#include <cusp/print.h>
#include <cusp/coo_matrix.h>
int main(void)
{
cusp::coo_matrix<int,double,cusp::device_memory> A(2,2,2);
A.values[0] = 1;
A.row_indices[0] = 0;
A.column_indices[0]= 0;
A.values[1] = 1;
A.row_indices[1] = 1;
A.column_indices[1]= 1;
cusp::coo_matrix<int, double, cusp::device_memory> B(2,2,4);
B.values[0] = 1;
B.row_indices[0] = 0;
B.column_indices[0]= 0;
B.values[1] = 2;
B.row_indices[1] = 0;
B.column_indices[1]= 1;
B.values[2] = 3;
B.row_indices[2] = 1;
B.column_indices[2]= 0;
B.values[3] = 4;
B.row_indices[3] = 1;
B.column_indices[3]= 1;
cusp::print(A);
cusp::print(B);
cusp::coo_matrix<int,double, cusp::device_memory> C(2,2,4);
cusp::multiply(A,B,C);
cusp::print(C);
}
因为 cusp:multiply() 是我发现的唯一乘法函数。
尖头 v.0.4 CUDA v.5.5