在研究 GPU 和使用它们的应用程序时,经常使用术语“内存带宽受限”和“计算受限”而没有严格定义它们。(或解释它们是什么)
关于这个问题,我有 2 个问题。
如果一个应用程序是内存带宽受限的,这是否意味着应用程序会运行得更快(瓶颈是内存访问带宽)和更好的内存访问速度?如果一个应用程序是计算受限的,这是否意味着如果它有更多的计算资源或更快的计算,它会显示出更高的性能?就像减少单个操作的延迟并拥有更多的 ALU 单元一样)
如果我的理解是真的,那么今天的大多数应用程序都是内存带宽受限的,而不是计算受限的。自从流行使用 GPU 以来,情况是否一直如此?