performance - 有效的循环崩溃

Question

在某些应用程序中，我需要将嵌套循环合并为一个，同时保留单独的索引信息。

for j in N:
  for i in M:
    ... A(i,j) ...

// Collapse the loops
for ij in MN:
  ... A(i,j) ...

所以已经研究了使用除法/模（昂贵的运算）和使用 if 语句（中断矢量化，分支预测问题）从 ij 恢复 i,j 的明显方法。最后我想出了以下内容（使用 C 风格的比较):

j += (i == m)
i *= (i != m)
++i, ++ij

是否有更好的方法来做到这一点？谢谢

score 8 · Accepted Answer

一般来说，如前所述折叠循环不会提供任何性能优势。

编译器有时确实会破坏这样的循环，但通常是以意想不到的方式。

在特定语言或特定平台上，您通常可以通过以下方式加速循环：

但是在所有情况下，您都必须对您的代码进行概要分析，才能看到这样的努力是有道理的。

一般来说，根据我的经验，像这样的嵌套循环主要由：

但这可能不适用于您的问题域和平台。简介！

score 0 · Accepted Answer

0

走其他路可能会更便宜。

for j in N:
  for i in M:
    ij=j*i+j

于 2010-01-22T06:45:10.623 回答

score 0 · Accepted Answer

我不确定你为什么要折叠循环。确保最内部的循环具有较高的行程计数（通过循环反转）并确保您的数据在内存中是连续的。当满足这两个条件时，我已经看到算法的运行速度提高了 10 倍。

3 回答 3