我目前正在使用 nvidia 的驱动程序“nvidia-smi”附带的工具在 GPU 上进行性能监控。当我们使用 'nvidia-smi -a' 时,它会给出当前 GPU 的信息,包括 GPU 核心和内存使用情况、温度等,如下所示:
==============NVSMI LOG==============
时间戳:星期二
2011 年 2 月 22 日 22:39:09
驱动程序版本:260.19.26
显卡 0:
Product Name : GeForce 8800 GTX PCI Device/Vendor ID : 19110de PCI Location ID : 0:4:0 Board Serial : 211561763875 Display : Connected Temperature : 55 C Fan Speed : 47% Utilization GPU : 1% Memory : 0%
我很好奇 GPU 和内存利用率是如何定义的?例如,GPU 核心的利用率为 47%。这意味着有 47% 的 SM 积极工作?或者所有的 GPU 内核在 47% 的时间内都处于忙碌状态,而在其他 53% 的时间里处于空闲状态?对于内存,利用率代表当前带宽与最大带宽之间的比率,还是上一个时间单位的繁忙时间比率?