8

我目前正在使用 nvidia 的驱动程序“nvidia-smi”附带的工具在 GPU 上进行性能监控。当我们使用 'nvidia-smi -a' 时,它会给出当前 GPU 的信息,包括 GPU 核心和内存使用情况、温度等,如下所示:

==============NVSMI LOG==============

时间戳:星期二

2011 年 2 月 22 日 22:39:09

驱动程序版本:260.19.26

显卡 0:

    Product Name            : GeForce 8800 GTX
    PCI Device/Vendor ID    : 19110de
    PCI Location ID         : 0:4:0
    Board Serial            : 211561763875
    Display                 : Connected
    Temperature             : 55 C
    Fan Speed               : 47%
    Utilization
        GPU                 : 1%
        Memory              : 0%

我很好奇 GPU 和内存利用率是如何定义的?例如,GPU 核心的利用率为 47%。这意味着有 47% 的 SM 积极工作?或者所有的 GPU 内核在 47% 的时间内都处于忙碌状态,而在其他 53% 的时间里处于空闲状态?对于内存,利用率代表当前带宽与最大带宽之间的比率,还是上一个时间单位的繁忙时间比率?

4

2 回答 2

5

一位版主在 NVIDIA 论坛上发帖称,GPU 利用率和内存利用率数据基于上一秒的活动:

GPU 繁忙实际上是上一秒 SM 繁忙的时间百分比,而内存利用率实际上是最后一秒内使用的带宽百分比。下一个版本附带完整的内存消耗统计信息。

于 2011-03-28T13:11:09.993 回答
2

可以参考这个官方API文档:http ://docs.nvidia.com/deploy/nvml-api/structnvmlUtilization__t.html#structnvmlUtilization__t

它说:“在过去的采样周期中,一个或多个内核在 GPU 上执行的时间百分比。”

于 2014-05-15T09:25:32.957 回答