据我所知,硬件预取器至少会检测并获取内存中的恒定步幅。此外,它可以监控数据访问模式,无论这意味着什么。这让我想知道,硬件预取器是根据存储在内存中的实际数据做出决定,还是纯粹基于程序表现出的行为?
我问的原因是因为我偶尔会使用“非本地”指针作为指针。一个简单的例子是一个预先分配的数组,以及索引这个数组的小整数而不是指针。如果我需要存储大量这样的“指针”,那么节省的内存可以快速增加,进而通过使用更少的内存间接提高缓存性能。
但据我所知,这可能会干扰硬件预取器的工作方式。或不!
我当然可以想象,不管现实与否,一个预取单元检查进入 L1 缓存的本地指针地址的缓存行,并开始将它们提取到 L2 或类似的东西中。在那种情况下,我节省内存的巧妙技巧突然显得不那么聪明了。
那么,现代硬件预取器到底是做什么的呢?它们会被“非本地”指针绊倒吗?