我有一个非常基本的问题,关于编译器(在我的情况下是 gcc)使用 -O 标志完成的优化。我想在这里只关注循环的矢量化。假设一个简单的 for 循环没有指针别名/竞争条件的危险。是否可以重写此循环,使编译器生成的带有 -O0 标志的代码与编译器对循环进行矢量化时一样快?
问问题
103 次
我有一个非常基本的问题,关于编译器(在我的情况下是 gcc)使用 -O 标志完成的优化。我想在这里只关注循环的矢量化。假设一个简单的 for 循环没有指针别名/竞争条件的危险。是否可以重写此循环,使编译器生成的带有 -O0 标志的代码与编译器对循环进行矢量化时一样快?