我正在 Linux 中编写 C 代码(可能稍后在 Windows 中),该代码包括具有并行处理的大规模线性代数计算。我正在使用处理大量工作的 GotoBLAS2。仍然有一些矩阵计算(尤其是稀疏矩阵)应该手动执行。我在互联网上搜索并找到了一些库,例如 Open MP。此外,线程似乎很有帮助。在 C 中进行并行计算的最佳方法是什么?谢谢
关于我的代码的附加信息:我特别关注稀疏矩阵向量乘法。另外,我有一大组向量 {v1, v2, v3, v4, ...},这些向量应该乘以不同的数字,这可以使用并行计算来执行。谢谢