1

我想在 C 中实现矩阵向量乘法。我的矩阵是 1000 * 1000^2 并且高度稀疏(小于 0.01% 的非零元素)。非零元素分散在各行之间(每行 0 到 126 个非零元素)。

我听说一般来说,使用并行处理进行稀疏矩阵向量乘法具有挑战性并且不如密集矩阵高效,因为计算与内存访问的比率很低(这里)。但是我无法真正理解稀疏矩阵和密集矩阵之间在并行计算方面的主要区别是什么,这使得稀疏矩阵的效率降低。密集矩阵似乎仍然存在同样的问题(如果我错了,请纠正我) .

如果让我知道在并行处理方面密集矩阵与稀疏矩阵有何不同,我们将不胜感激。谢谢

4

0 回答 0