问题标签 [nvml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
767 浏览

cuda - Using nvidia-smi what is the best strategy to capture power

I am using Tesla K20c and measuring power with nvidia-smi as my application is run. My problem is power consumption does not reach a steady state but keeps rising. For example, if my application runs for 100 iterations, power reaches 106W(in 4 seconds), for 1000 iterations 117 W (in 41 seconds), for 10000 iterations 122W (in 415 seconds) and so on increasing slightly every time. I am writing for some recommendation on which power value I should record. In my experimental setup I have over 400 experiments, and doing each one for 10000 iterations is not feasible at least for now. The application is matrix multiplication which is doable in just one iteration taking just a few milliseconds. Increasing the number of iterations does not bring any value to the results, but it increases the run time allowing power monitoring.

0 投票
1 回答
5067 浏览

cuda - NVML 代码无法编译

我正在实现一个带有nvml库的示例程序,如https://devtalk.nvidia.com/default/topic/504951/how-to-call-nvml-apis-/

程序如下:

生成文件如下:

我得到的错误是:

任何帮助,将不胜感激。谢谢你。

0 投票
1 回答
372 浏览

gpu - nvmlDeviceGetPowerManagementMode() 总是返回 NVML_ERROR_INVALID_ARGUMENT?

我正在编写代码来定期使用 NVML API 测量 NVIDIA Tesla K20 GPU(Kepler 架构)的功耗。

变量

基本代码

我的问题是nvmlDeviceGetPowerManagementMode总是返回NVML_ERROR_INVALID_ARGUMENT。我检查了这个。

NVML API 文档说,NVML_ERROR_INVALID_ARGUMENTnvmlDeviceID无效pmmodeNULL.

nvmlDeviceID绝对有效,因为我能够查询与我的 GPU 匹配的属性。但我不明白为什么我应该将值设置pmmode为任何东西,因为文档说它是一个Reference in which to return the current power management mode. 作为记录,我尝试为其分配一个启用值,但结果仍然相同。

我显然做错了,因为系统的其他用户已经使用此功能编写了自己的库,并且他们没有遇到任何问题。我无法联系到他们。我应该修复什么才能使此功能正常工作?

0 投票
0 回答
567 浏览

gcc - 错误:bool 未声明(函数中首次使用)。已经包含在代码中

我正在尝试将 Perl 绑定编译到 Nvidia 管理库 (NVML)。当我使用makefile时,出现以下错误:

gcc 版本为:gcc (Ubuntu/IBM 5.4.0-6ubuntu1~16.04.2) 5.4.0 20160609

我在handy.h 中包含了stdbool.h 文件。

0 投票
1 回答
4662 浏览

installation - NVML 库路径

我使用带有以下标志的 cmake (3.5.1) 编译了一个软件 (GROMACS 2016.3):

cmake .. -DGMX_BUILD_OWN_FFTW=ON -DREGRESSIONTEST_DOWNLOAD=ON -DGMX_MPI=on -DGMX_GPU=on -DGMX_OPENMP=on -DCUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda-8.0 -DGPU_DEPLOYMENT_KIT_ROOT_DIR=/usr/local/cuda-8.0

CUDA 库 8.0 是使用默认路径从 deb 安装的。

当软件运行时,它会发出警告为GROMACS was configured without NVML support...。Recompile with the NVML library

我怎样才能让它看到这样的图书馆?我是否给 cmake 提供了错误的路径?(编译 gromacs 时不会出现警告或错误)。

非常感谢

0 投票
1 回答
2928 浏览

gpu - NVIDIA-SMI、NVML、电源使用情况:[不支持]

我尝试在 Windows 10 x64 中使用以下命令获取当前电源使用情况:

nvidia-smi.exe --format=csv,noheader --query-gpu=power.draw

并得到下一个结果:

[不支持]

我在 GTX1050(笔记本)显卡上检查了它。另请参阅 nvidia-smi 输出:

还尝试通过 NVML 库获取此信息:

输出是一样的:

不支持

第一个问题:是否存在从不支持的 NVIDIA 卡获取电源使用或其他参数的方法?
另请参阅旧 手册中的功能矩阵部分, 其中包含有关支持的 NVIDIA 卡的功能的信息。
第二个问题:是否存在有关新视频卡的此类文档?

0 投票
1 回答
342 浏览

c++ - AMD 的 NVML 对应物 (c++)

我想知道 AMD 有什么库可以模仿 nvidia 的 NVML 对应物。我想要的是在 C++ 中获得温度、功耗等。

此致!

0 投票
2 回答
483 浏览

parallel-processing - GPU MHZ 利用率

我正在为 GPU 卡开发一个监控代理,它能够使用 CUDA 和 NVML 库提供实时遥测。

我想了解更多关于 GPU 核心操作与 Intel/AMD CPU 核心如何工作的信息。

可用于 CPU 的一种公式是(cpumhz 或工作负载平均峰值 CPU 利用率 (MHz)),如下所示:

更多详细信息在这里 https://vikernel.wordpress.com/tag/vmware-formulas/

那么同样的公式可以应用于 GPU 是否正确。例外情况是 CUDA 核心/着色器代替“核心”,或者我可以将当​​前时钟速度乘以实际 gpu 时钟使用情况,因为 GPU 有一个核心时钟用于其 1000 个核心/着色器。

例如:

0 投票
1 回答
1405 浏览

windows-10 - 如何使用 python 测量 Windows 中每个进程的 GPU 使用率?

我想像在 Windows taskmgr.exe 中那样测量每个进程的 GPU 使用率,但是在尝试使用 pyNVML 库时遇到了几个问题。结果,我有几个问题。

首先,目前是否可以使用 Python 测量 Windows 中每个进程的确切 GPU 使用率?我已经尝试过nvidia-smi查询,但这似乎没有显示每个进程的内存使用和利用率百分比。

其次,如果可以使用 Python 以这种方式测量 GPU 使用率,我想以与 Windows 10 的 Windows taskmgr.exe 类似的方式测量和显示它。

到目前为止,这是我的代码:

我的结果:

英伟达-smi

如您所见,这并没有显示每个进程的 GPU 内存使用情况,但我需要 taskmgr 的 GPU 部分中显示的信息。(我不需要可视化。)

任务管理器

我的电脑规格是 Windows 10 pro、GTX 950、i5-6600

如果目前在 Python 中这是不可能的,您是否有任何其他建议可以自动收集每个进程的 GPU 使用情况。

谢谢你。

0 投票
1 回答
469 浏览

nvidia - NVML 和 NVAPI 如何比较?

我想获取一些基本的 GPU 数据:名称、RAM 大小和进行温度监控。

从 NVIDIA 文档中,不清楚使用哪个库。NVAPI 是应该避免的遗留 API 吗?