1

我编写了一个内核,它在指令获取方面存在一些问题。超过 75% 的问题停止原因是由于指令获取。

我不知道如何改善这一点。Nvidia 没有说明指令获取策略,Nsight 文档也没有带来任何启示:“如果尚未获取下一条汇编指令,则指令获取停止原因。”

有什么办法可以避免这个问题(或减少影响)?在此处输入图像描述

4

0 回答 0