10

据我了解,返回堆栈缓冲区仅支持 4 到 16 个条目(来自 wiki:http ://en.wikipedia.org/wiki/Branch_predictor#Prediction_of_function_returns )并且不是键值对(基于 ret 指令的位置索引)。这是真的吗?当上下文切换发生时 RSB 会发生什么?

假设我们在返回堆栈缓冲区长度为 16 的 CPU 中处理了 50 个未返回的函数,之后会发生什么?这是否意味着所有预测都失败了?你能举例说明吗?这种情况在递归函数调用中是否相同?

4

1 回答 1

1

BPU 可以包含自己的 RAS 预测器,当它预测 BTB 中的调用类型时,它将假定的调用 NLIP(以下指令的 IP)推送到 RAS 堆栈。它在 BTB 中预测的下一次返回将使用 RAS 的顶部作为预测地址(就像当它预测常规间接分支时,ITA 中的并行命中将超过 BTB 中的目标地址)。

BAC 将在解码时通过将每个调用指令的 NLIP 推送到其自己的 RSB 来验证/覆盖这些返回目标预测,下一个返回地址的预测将与该地址进行比较。如果不正确,BAC 将发出 BAclear 并在管道开始处将下一个 IP 逻辑重新引导到正确的返回地址(如果 RSB 损坏,这可能会被证明是错误的)。它可能会用 BAC RSB 状态覆盖 RAS 预测器堆栈。

在一种实现方式中,BAC 向 TOS 指针提供它验证的每个分支预测,以及落入地址。一旦执行了分支并且知道了实际结果,如果发生错误预测,则恢复 RSB TOS。我认为更有效的是在退休时拥有一个架构 RSB,它在管道刷新/错误预测时被复制到 BAC RSB 和 RAS 预测器中。这可以防止恢复到损坏的 RSB。

RAS 预测器可能是一个循环堆栈,它可能有也可能没有上溢和下溢检查和保证,具体取决于实现。当堆栈已满时,新的预测可能会覆盖最旧的预测,以便它始终是最新的(而不是阻止它在已满时添加,这意味着保留一个计数器来确定有多少调用/返回它无法进行预测为了)。至于下溢,它可能拒绝进行预测,而是使用 ITA 进行预测。如果 RSB 下溢,它可能不会覆盖 RAS 预测器所做的预测。

上下文切换的硬件中断会导致在执行宏操作的最终微指令时清除流水线。RSB 很可能恢复到架构状态以在中断后继续。预测器 RAS / BAC RSB 很可能在微码中被刷新,如果它被损坏,它最终会自行恢复。

于 2021-02-06T12:01:13.087 回答