5

什么是“GPU 中的内存绑定内核和计算绑定内核”

这与GPU的性能有关吗?

4

1 回答 1

5

通俗地说,如果内核的大部分时间都花在执行内存指令上,那么内核就是内存受限的。相反,如果大多数操作都是 ALU-FPU 指令,则内核是计算密集型的。GPU 具有很高的内存和计算带宽,可以同时适用于这两个类别。这些术语用于分类并指示哪些优化技术可以显着提高应用程序的性能。

每个类别的工作负载都有不同的优化技巧。

例如,对于内存绑定的工作负载:

  • 利用共享内存
  • 内存访问合并
  • 记忆露营。

对于计算密集型工作负载:

  • 减少分支分歧
  • ALU-FPU 和 SFU 之间的交错计算
  • 提供足够的独立指令来利用 ILP。
于 2012-10-10T09:13:35.710 回答