问题标签 [amd-gpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1083 浏览

shared-libraries - libGL 开放驱动程序:“未定义符号:amdgpu_query_sensor_info”,glxgears 工作正常

我的配置:

我尝试运行与 libGL 一起使用的 QTCreator,但它崩溃并出现以下错误:

我运行 glxgears,它可以工作(我看到轮子在移动),它显示了它使用的驱动程序:

我尝试创建一个符号链接以使 QTCreator 使用与 glxgears 相同的库:

这是我所有的 libGL.so 文件:

那么我应该怎么做才能使用与 glxgears 相同的 libGL 库来制作 QTCreator?

0 投票
1 回答
781 浏览

ubuntu - 安装 amdgpu-pro 后在 ubuntu 中未检测到 RX580

我按照这里的官方教程安装了 amdgpu-pro 。dpkg -l amdgpu-pro我能够通过with来检查 amdgpu-pro 是否正确安装ii。但是,当我radeontop用来检查我的 GPU 状态时,它无法被检测到。我认为这可能是radeontop问题,所以我使用了其他 GPU 监控脚本,但它们都没有成功注册我的 GPU。

另外,当我尝试用这个示例测试 OpenCL 时,出现了 Error: Failed to create a device group!

我在 Ubuntu 16.04 上使用 radeon RX580

0 投票
1 回答
406 浏览

linux - AMD OpenCL 在 Linux 上工作所需的最小文件子集是什么?

我已经使用 buildroot 构建了 Linux 内核。我已将开源 amdgpu 驱动程序和所需的固件合并到其中。驱动程序很好,检测 GPU,模式设置效果很好,为“小文本”调整分辨率,启动后显示命令行。

现在我需要运行 OpenCL 程序。我从 amdgpu-pro 驱动程序(rhel7 变体)中手动解压文件并组装骨架 fs,然后复制我认为需要的文件。

OpenCL 无法识别调用中的任何设备和clinfo实用程序抛出cl::errorcl::getPlatformIDs()

OpenCL 在 linux 上完全工作需要哪些文件?

PS:相关的未回答问题,因此该主题被认为是实际的。

0 投票
0 回答
223 浏览

opencl - clinfo.exe 崩溃并出现错误

clinfo.exe 错误 我不知道如何解决。在运行命令 clinfo 之前,我可以使用 CodeXL Teapot 示例并对其进行调试和分析。在我运行 clinfo 命令后,CodeXL Teapot 示例也崩溃了。当我卸载AMD APP SDK 3.0时,clinfo命令没有错误,CodeXL也恢复了。我的系统是 windows 10 X64,GPU 是 AMD FirePro W7100,AMD APP SDK 是 X64。谁能给我一些建议?

0 投票
1 回答
89 浏览

c++ - 解释一个函数

我目前正在分析 AMD ADL sdk 并发现非常有趣的功能

我了解此功能正在搜索响应式 AMD GPU 散热设备,但为什么它需要在这样的功能中

几乎所有的 amd ADL 函数都在使用这个 FindTController 函数,它真的很重要还是只是蛇油?

0 投票
1 回答
214 浏览

opencl - AMD GCN 卡上的 OpenCL 中的 uint2 操作是否比 ulong 更快?

哪个“+”计算更快?1) uint2 a, b, c; c = a + b; 2)乌龙a、b、c;c = a + b;

0 投票
1 回答
466 浏览

multithreading - OpenGL PBO 映射缓冲区:多线程解包慢,memcpy 快

我们正在开发工作站 Core i7 和 AMD FirePro 8000。对于视频解码(8K,7680x4320 视频帧 ~ 66MB hapq 编解码器),我们尝试使用以下明显的循环:

  1. 从流中获取帧
  2. 地图缓冲区
  3. 多线程解码帧切片到映射缓冲区
  4. 取消映射缓冲区
  5. texsubimage 从绑定的 PBO 转换为纹理

但是步骤 3. 将多线程切片解码到映射缓冲区 非常慢 - 至少需要大约 40 毫秒才能完成

当我们把它分成两个步骤时

3a。将多线程的帧切片解码到分配的内存中

3b。memcpy 从 malloced 内存到映射缓冲区

两个步骤都需要 8+9 ~ 17ms 才能完成。现在我们有了一个可以接受的解决方案,但是额外的复制步骤很痛苦。

为什么多线程解包到映射内存如此缓慢?我们如何避免额外的复制步骤?

编辑1;

这是缓冲区的生成、定义和映射方式:

编辑2:

有人提出了如何测量时间的问题。仅测量非 gl 代码。伪代码是这样的,

案例1(很慢,t2-t1~40ms):

案例2(中慢,t3-t2~9ms,t2-t1~8ms):

在测量的代码块内不涉及 OpenGL 代码。也许这是一个直写/ cpu-cache 问题。

0 投票
1 回答
250 浏览

opencl - 如何解决 Debian 上的 CL_INVALID_BUILD_OPTIONS 问题?

我似乎已经成功构建了这个项目https://github.com/sowson/darknet,但是当我尝试运行它时,我得到了这个输出。

我不太确定如何提出我的问题或在哪里寻找答案。任何信息都有帮助。

0 投票
1 回答
1415 浏览

tensorflow - Ubuntu 16.04 上带有 Tensorflow 和 OpenCL 的多个 AMD GPU

经过一番挣扎:

  1. 在带有amdgpu 17.50的全新Ubuntu 16.04上使用 OpenCL 成功构建了 Tensorflow 。

  2. 安装了 5 个相同的 GPU (rx580),所有这些 GPU 都按预期由 clinfo 和 computecpp_info 报告。

  3. 运行 MNIST convnet 示例,TF 可以工作,但只使用 GPU0 而没有看到其他 GPU

dmesg中没有报关于卡的错误,他们似乎都在最底层准备好了,不知道为什么SYCL似乎忽略了一些卡

这是computecpp_info输出:

这是来自tensorflow的列表:

编辑:重启后

我真的不知道这些警告是否相关,因为它们在第一次运行后就消失了。

编辑:dmesg 详细信息

编辑:它与任何特定的卡无关,只是总线顺序中的第一个可用。

我尝试断开一些卡的连接,在所有测试之后,似乎很清楚 SYCL 总是只列出第一个 GPU,不管是哪一个,总是最小的可用总线号。

这也证实了卡之间没有差异,并且所有卡都可以使用(至少单独使用),所以我认为操作系统很好,我猜问题出在 SYCL 中。

请帮忙!

0 投票
1 回答
685 浏览

opencl - 如何将 OpenCL 代码从 FP32 转换为 FP16?

有没有办法自动转换为在 FP32 GPU 上进行 FP32 计算而编写的代码,所以它总是可以进行 FP16 计算而不是 FP32?

我想要实现的是为旧 GPU(不支持 HALF 类型)运行代码,以在更新的 GPU 上运行......但我自己不通过代码......

如果不可能,请告诉我应该阅读哪些文件,自己动手做...

(新的 GPU 是 Radeon Vega Frontier,驱动程序是 ROCm 1.9.1,操作系统是 Ubuntu 18.04)(代码很广泛,由不同的模块组成......所以我不会在这里发布,除非被要求)