有什么方法可以让我知道免费/活跃 SM 的数量吗?或者至少读取每个 SM 的电压/功率或温度值,我可以通过它知道它是否工作?(在 gpu 设备上执行某些作业时实时)。
%smid 帮助我知道了每个 SM 的 ID。类似的东西会有所帮助。
谢谢和问候, 拉克什
CUDA 分析工具接口 ( CUPTI ) 包含一个事件 API,它支持 GPU PM 计数器的运行时采样。CUPTI SDK 作为 CUDA 工具包的一部分提供。有关采样的文档可以在 CUPTI Events API\ Sampling Events部分找到。
以下一个或多个计数器将使您对 SM 活动有一个很好的了解: