我是并行计算和寻找选项和技巧的新手。
我现在的问题是找到 2 32 个B = AX 类型的独立线性方程;其中 A[8x8]、B[8x1] 和 X[8x1] 的尺寸;A 是密集矩阵。
我在 Intel core 7i 处理器、4 核、8 线程和 Mac 机器上按顺序使用 CLAPACK - zgelss 函数。
此外,我的矩阵大小似乎足够小,可以使用内部优化。
我想在这个循环上应用并行性:
for (n = 0; n < 2^32; n++)
{...}
我想问我有什么选择来做到这一点。
一些人建议使用OpenMP,但在阅读了 OpenMP 之后,我发现我们无法将 OpenMP 指令应用于预编译的代码部分。
如果我们这样做,它可以工作,但它可能不安全,因为您不能将预编译函数中的临时变量私有化。{请评论对/错/其他}
所以我想问一下,如果可能的话,怎么做。一些技巧......任何东西......