0

我正在开发一个科学代码,所以速度当然是最重要的。现在因为可移植性并不是一个真正的问题,所以我知道在编译程序时我已经有多少个 openmp 线程可用。我可以使用这些信息来执行任何额外的优化吗?如果是,我该怎么做?

既然有人指出这个问题非常广泛。我想减少一点自动,即编译器优化。所以设置编译器标志或类似的东西。

干杯

-一个

4

1 回答 1

0

好吧,您可以修改代码,使其可以划分为 n 个独立区域(n=线程数)。你应该更喜欢使用部分。由于减少了处理器间的通信,与并行 for 循环相比,它们提供了更好的加速。

于 2012-05-07T08:04:51.420 回答