7

在这张幻灯片 中(在幻灯片 15 之后),建议使用

void updateAims(float* aimDir, const AimingData* aim, vec3 target, uint count)
{
     for(uint i = 0; i < count; i++)
     {
          aimDir[i] = dot3(aim->positions[i], target) * aim->mod[i];
     }
}

因为它的缓存效率更高。

如果我有课怎么办

class Bot
{
    vec3 position;
    float mod;
    float aimDir;

    void UpdateAim(vec3 target)
    {
         aimDir = dot3(position, target) * mod;
    }
 };

 void updateBots(Bots* pBots, uint count, vec3 target)
 {
      for(uint i = 0; i < count; i++)
            pBots[i]->UpdateAim(target);
  }

我将该类的所有对象存储在一个线性数组中。

由于它们都在同一个数组中,会有缓存未命中吗?为什么第一种方法会更好?

4

2 回答 2

11

现代缓存体系结构通常构造为数据,每行大到足以容纳几个字;64 字节是典型的行大小。当您尝试读取不在缓存中的数据时,将获取整行,而不仅仅是您需要的单词。写入时,如果缓存中的数据存在则更新,但如果不存在则通常不需要获取。

在第一种情况下,对于获取的输入数据的每个缓存行,您将使用它的每个单词。在第二个中,您将只使用一些结构字段;获取其他人浪费了一些带宽。

具体来说,您正在获取aimDir每次的旧值,计算不需要它。通常,“对象”可能包含更多字段,您不希望这些字段用于此特定计算,因为它们被提取到缓存中然后被忽略,从而浪费更多带宽。

于 2012-08-27T12:23:15.283 回答
0

内存布局差异很大,如果您使用机器人数组,第一种方法的好处将被破坏。

在第一种方法中,所有aimDir数据都存储在非分段的内存块中。因此,如果您处理了第一个项目,您可以立即继续处理下一个项目,因为它存储在下一个内存单元中。

如果您有一个Bots 数组,那么您将Bot对象存储在一个非分段的内存块中。但是aimDir现在两个机器人的不同数据由 bot (positionmod) 与其他数据分开。

从图形上看,第一种方法(如果也假设位置和 mod 的数组)看起来像

[R] 表示与机器人无关的随机未知数据

[R][position_0][position_1]...[position_n][R][mod_0][mod_1]...[mod_n][R][aimDir_0][aimDir_1]...[aimDir_n][R]

第二种方法如下所示:

[R][[position_0],[mod_0],[aimDir_0]][[position_1][mod_1][aimDir_1]]...[[position_n][mod_n][aimDir_n]][R]
于 2012-08-27T12:25:49.543 回答