问题标签 [amd-gpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
shared-libraries - libGL 开放驱动程序:“未定义符号:amdgpu_query_sensor_info”,glxgears 工作正常
我的配置:
我尝试运行与 libGL 一起使用的 QTCreator,但它崩溃并出现以下错误:
我运行 glxgears,它可以工作(我看到轮子在移动),它显示了它使用的驱动程序:
我尝试创建一个符号链接以使 QTCreator 使用与 glxgears 相同的库:
这是我所有的 libGL.so 文件:
那么我应该怎么做才能使用与 glxgears 相同的 libGL 库来制作 QTCreator?
linux - AMD OpenCL 在 Linux 上工作所需的最小文件子集是什么?
我已经使用 buildroot 构建了 Linux 内核。我已将开源 amdgpu 驱动程序和所需的固件合并到其中。驱动程序很好,检测 GPU,模式设置效果很好,为“小文本”调整分辨率,启动后显示命令行。
现在我需要运行 OpenCL 程序。我从 amdgpu-pro 驱动程序(rhel7 变体)中手动解压文件并组装骨架 fs,然后复制我认为需要的文件。
OpenCL 无法识别调用中的任何设备和clinfo
实用程序抛出cl::error
。cl::getPlatformIDs()
OpenCL 在 linux 上完全工作需要哪些文件?
PS:相关的未回答问题,因此该主题被认为是实际的。
opencl - clinfo.exe 崩溃并出现错误
clinfo.exe 错误 我不知道如何解决。在运行命令 clinfo 之前,我可以使用 CodeXL Teapot 示例并对其进行调试和分析。在我运行 clinfo 命令后,CodeXL Teapot 示例也崩溃了。当我卸载AMD APP SDK 3.0时,clinfo命令没有错误,CodeXL也恢复了。我的系统是 windows 10 X64,GPU 是 AMD FirePro W7100,AMD APP SDK 是 X64。谁能给我一些建议?
c++ - 解释一个函数
我目前正在分析 AMD ADL sdk 并发现非常有趣的功能
我了解此功能正在搜索响应式 AMD GPU 散热设备,但为什么它需要在这样的功能中
几乎所有的 amd ADL 函数都在使用这个 FindTController 函数,它真的很重要还是只是蛇油?
opencl - AMD GCN 卡上的 OpenCL 中的 uint2 操作是否比 ulong 更快?
哪个“+”计算更快?1) uint2 a, b, c; c = a + b; 2)乌龙a、b、c;c = a + b;
multithreading - OpenGL PBO 映射缓冲区:多线程解包慢,memcpy 快
我们正在开发工作站 Core i7 和 AMD FirePro 8000。对于视频解码(8K,7680x4320 视频帧 ~ 66MB hapq 编解码器),我们尝试使用以下明显的循环:
- 从流中获取帧
- 地图缓冲区
- 多线程解码帧切片到映射缓冲区
- 取消映射缓冲区
- texsubimage 从绑定的 PBO 转换为纹理
但是步骤 3. 将多线程切片解码到映射缓冲区 非常慢 - 至少需要大约 40 毫秒才能完成
当我们把它分成两个步骤时
3a。将多线程的帧切片解码到分配的内存中
3b。memcpy 从 malloced 内存到映射缓冲区
两个步骤都需要 8+9 ~ 17ms 才能完成。现在我们有了一个可以接受的解决方案,但是额外的复制步骤很痛苦。
为什么多线程解包到映射内存如此缓慢?我们如何避免额外的复制步骤?
编辑1;
这是缓冲区的生成、定义和映射方式:
编辑2:
有人提出了如何测量时间的问题。仅测量非 gl 代码。伪代码是这样的,
案例1(很慢,t2-t1~40ms):
案例2(中慢,t3-t2~9ms,t2-t1~8ms):
在测量的代码块内不涉及 OpenGL 代码。也许这是一个直写/ cpu-cache 问题。
opencl - 如何解决 Debian 上的 CL_INVALID_BUILD_OPTIONS 问题?
我似乎已经成功构建了这个项目https://github.com/sowson/darknet,但是当我尝试运行它时,我得到了这个输出。
我不太确定如何提出我的问题或在哪里寻找答案。任何信息都有帮助。
tensorflow - Ubuntu 16.04 上带有 Tensorflow 和 OpenCL 的多个 AMD GPU
经过一番挣扎:
在带有amdgpu 17.50的全新Ubuntu 16.04上使用 OpenCL 成功构建了 Tensorflow 。
安装了 5 个相同的 GPU (rx580),所有这些 GPU 都按预期由 clinfo 和 computecpp_info 报告。
运行 MNIST convnet 示例,TF 可以工作,但只使用 GPU0 而没有看到其他 GPU。
dmesg中没有报关于卡的错误,他们似乎都在最底层准备好了,不知道为什么SYCL似乎忽略了一些卡。
这是computecpp_info输出:
这是来自tensorflow的列表:
编辑:重启后
我真的不知道这些警告是否相关,因为它们在第一次运行后就消失了。
编辑:dmesg 详细信息
编辑:它与任何特定的卡无关,只是总线顺序中的第一个可用。
我尝试断开一些卡的连接,在所有测试之后,似乎很清楚 SYCL 总是只列出第一个 GPU,不管是哪一个,总是最小的可用总线号。
这也证实了卡之间没有差异,并且所有卡都可以使用(至少单独使用),所以我认为操作系统很好,我猜问题出在 SYCL 中。
请帮忙!
opencl - 如何将 OpenCL 代码从 FP32 转换为 FP16?
有没有办法自动转换为在 FP32 GPU 上进行 FP32 计算而编写的代码,所以它总是可以进行 FP16 计算而不是 FP32?
我想要实现的是为旧 GPU(不支持 HALF 类型)运行代码,以在更新的 GPU 上运行......但我自己不通过代码......
如果不可能,请告诉我应该阅读哪些文件,自己动手做...
(新的 GPU 是 Radeon Vega Frontier,驱动程序是 ROCm 1.9.1,操作系统是 Ubuntu 18.04)(代码很广泛,由不同的模块组成......所以我不会在这里发布,除非被要求)