0

根据此文档,此命令nvidia-smi --query-gpu=utilization.gpu --format=csv测量“过去采样周期内一个或多个内核在 GPU 上执行的时间百分比。”这意味着,如果在过去的采样周期内有多个内核一个接一个地运行,则利用率将是 100%,这显然是不合适的 - 100% 的利用率直观地意味着所有 SM 都在满负荷运行(它们都充满了正在运行的内核),(更好的是,所有内核都在运行以 100% 的频率,但这太好了,难以置信)。

nvidia 有 API 来提供更好的指标吗?还是我误解了什么?还是这只是 nvidia 故意欺骗您购买更多 GPU 的事情?

作为参考,top在 Irix 模式关闭的情况下,如果多核 CPU 上只有一个内核处于活动状态,则利用率将远低于 100。

4

0 回答 0