问题标签 [nvml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - NVML 头文件丢失
我正在尝试执行一些 CUDA 代码,这些代码恰好具有一些 NVML 库函数,例如 nvmlSystemGetDriverVersion。但是,当我尝试编译代码时,它显示 nvml.h 未找到。我应该如何在我的系统上安装 NVML,因为它似乎不存在 nvml.h?
cuda - NVML 中的 nvidia-smi -ac 等效项
我了解到 nvidia-smi -ac 可用于更改 GPU 内核和内存的时钟频率。nvidia-smi 是基于 NVML 库构建的吗?自从我检查了文档以来,它在 NVML 中的等价物是什么
http://cyber.sibsutis.ru:82/GPGPU/sdk/CUDA_TOOLKIT/nvml.pdf
但只能看到用于获取时钟速率值而不是设置它们的 API?
谢谢
cuda - GPU 利用率
我一直在使用 NVML 库来获取 Rodinia 基准套件的图形和内存利用率值。我观察到,对于不同的频率,同一应用程序的利用率显示出不同的值。从 wiki 链接http://en.wikipedia.org/wiki/CPU_usage看来,它似乎没有考虑到内存、分支等各种停顿。在一个时间间隔内,这种利用率到底是什么?以及它的值如何随着频率的变化而变化。
谢谢
cuda - 无法运行查询 NVML 的 CUDA 代码 - 有关 libnvidia-ml.so 的错误
最近有同事需要使用NVML查询设备信息,于是下载了Tesla开发包3.304.5,将文件nvml.h复制到/usr/include。为了测试,我在 tdk_3.304.5/nvml/example 中编译了示例代码,它运行良好。
一个周末,系统发生了一些变化(我无法确定发生了什么变化,而且我不是唯一可以访问机器的人),现在任何使用 nvml.h 的代码(例如示例代码)都失败并出现以下错误:
但是,我仍然可以运行 nvidia-smi 并读取有关我的 K20m 状态的信息,据我所知,nvidia-smi 只是对 nvml.h 的一组调用。我收到的错误消息有点神秘,但我相信它告诉我 nvidia-ml.so 文件需要与我在系统上安装的 Tesla 驱动程序相匹配。为了确保一切正确,我重新下载了 CUDA 5.0 并安装了驱动程序、CUDA 运行时和测试文件。我确信 nvidia-ml.so 文件与驱动程序匹配(两者都是 304.54),所以我很困惑可能出了什么问题。我可以使用 nvcc 编译和运行测试代码,也可以运行我自己的 CUDA 代码,只要它不包含 nvml.h。
有没有人遇到过这个错误或者有任何关于纠正这个问题的想法?
编辑:解决方案是删除所有额外的 libnvidia-ml.so 实例。出于某种原因,他们有很多。
cuda - 使用 nvmlDeviceGetPowerUsage 读取 NVML 功率读数
我正在使用 NVML 函数 nvmlDeviceGetPowerUsage() 运行应用程序。
问题是我在 TESLA M2050 上运行的不同应用程序总是得到相同的数字。
有什么建议么?
nvidia - Nvidia-smi 显示风扇速度不可用
我的机器有 nvidia Tesla K20m gpu。我想知道 gpu 利用率、内存利用率、温度和风扇速度。所以我使用nvidia-smi来了解细节。Nvidia-smi 日志如下
怎么知道风扇转速。有没有插件?谁能帮我?
cuda - 如何获得gpu的利用率?(nvml)
我的 cuda 项目测试需要 gpu 信息。
我正在使用 nvml 库,并且成功获取了温度信息。但是,nvml 在 nvmlDeviceGetUtilizationRates() 中报告 ERROR_NOT_SUPPORTED。
那么现在,如何获取gpu的使用率呢?显然,会有类似 NVIDIA GeForce Experience 的方式。
谢谢,
ps 哎呀!我的声望不够...如果您想查看 NVIDIA GeForce Experience 示例图像,请单击此链接。
cuda - 有没有办法甚至可能在一段时间内获得 GPU 的整体利用率?
我试图在一段时间内获取有关 GPU 整体利用率的信息(我的是 NVIDIA Tesla K20,在 Linux 上运行)。“整体”是指计划运行多少个流式多处理器,以及计划运行多少个 GPU 内核(我想如果一个内核正在运行,它将以其全速/频率运行?)。如果我能得到以 flops 衡量的整体利用率,那就太好了。
当然,在这里提出问题之前,我已经搜索和调查了几个现有的工具/库,包括 NVML(以及基于它构建的 nvidia-smi)、CUPTI(和 nvprof)、PAPI、TAU 和 Vampir。但是,似乎(但我还不确定)他们都无法为我提供所需的信息。例如,NVML 可以按百分比报告“GPU 利用率”,但根据其文档/评论,此利用率是“过去一秒内一个或多个内核在 GPU 上执行的时间百分比”,这显然不够准确. 对于 nvprof,它可以报告单个内核的失败(开销非常高),但我仍然不知道 GPU 的利用率如何。
PAPI 似乎能够获得指令计数,但它不能与其他浮点运算不同。我还没有尝试过其他两种工具(TAU 和 Vampir),但我怀疑它们能否满足我的需求。
所以我想知道是否有可能获得 GPU 的整体利用率信息?如果不是,估计它的最佳选择是什么?我这样做的目的是为在 GPU 上运行的多个作业找到更好的时间表。
我不确定我是否已经足够清楚地描述了我的问题,所以请让我知道是否可以添加任何内容以获得更好的描述。
非常感谢!
cuda - Jetson TK1 支持 NVML?
我在 Jetson TK1 上安装了 NVML 并编译了一个 cuda 程序。编译没有显示任何错误,但运行时显示错误
/NVML-installed-path/usr/src/gdk/nvml/lib//libnvidia-ml.so:文件无法识别:文件格式无法识别。
下载的 NVML 库适用于 Linux 64 位。Jetson TK1 是否支持 NVML 库?
谢谢
cuda - 如何获得 gpu 利用率?
以前,我使用函数 nvmlDeviceGetUtilizationRates() 尝试了 NVML。我通过这种方式测试它,当集合运行时,我在 Tesla C2070 上执行了一个 DFT(内核组织为 <7,32>),它有 14 个 SM,在我看来,在 GPU 上执行了 7 个块同时,利用率应该是50%,但是API给出的结果是99%,这意味着GPU被完全使用了。然后,我阅读了 NVML 的文档,nvmlDeviceGetUtilizationRates() 只能返回过去采样期间在 GPU 上执行一个或多个内核的时间百分比。当某些内核在 GPU 上运行时,如何获取活动的 SM 编号?