我正在开发一个科学代码,所以速度当然是最重要的。现在因为可移植性并不是一个真正的问题,所以我知道在编译程序时我已经有多少个 openmp 线程可用。我可以使用这些信息来执行任何额外的优化吗?如果是,我该怎么做?
既然有人指出这个问题非常广泛。我想减少一点自动,即编译器优化。所以设置编译器标志或类似的东西。
干杯
-一个
我正在开发一个科学代码,所以速度当然是最重要的。现在因为可移植性并不是一个真正的问题,所以我知道在编译程序时我已经有多少个 openmp 线程可用。我可以使用这些信息来执行任何额外的优化吗?如果是,我该怎么做?
既然有人指出这个问题非常广泛。我想减少一点自动,即编译器优化。所以设置编译器标志或类似的东西。
干杯
-一个