问题标签 [gpgpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2753 浏览

cuda - 请推荐用于GPU编程的显卡

我正在寻找用于试验 GPU 编程的显卡的推荐。我更倾向于 OpenCL 而不是 CUDA。还要寻找价格合理的卡(有 50 美元或更低的卡吗?)

0 投票
1 回答
1192 浏览

algorithm - CUDA 高效多边形填充算法

我需要有效的填充算法来填充封闭的多边形(例如扫描线填充),我可以在 CUDA 上运行它。你有什么建议吗?

提前感谢任何重播!

0 投票
1 回答
1183 浏览

c - 在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(汽车、人)的工作代码示例?

我在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(计算机视觉的一部分)的工作代码?非常感谢提前。

0 投票
3 回答
5294 浏览

opencl - 是否可以将 OpenCL 用于 PowerVR SGX530 GPU 设备?

是否可以将 OpenCL 用于 PowerVR SGX530 GPU 设备?我必须编写可以在 Droid X 智能手机上运行的图像识别软件。如果有人可以提供链接、参考、引用、示例代码,我将不胜感激。

0 投票
2 回答
1559 浏览

cuda - 在使用 CUDA 工具包 OpenCL sdk 进行开发时,我可以通过 OpenCL 以 CPU 为目标吗?

我是 GPGPU 概念的新手,在过去的几个月里,我一直在慢慢地自学 CUDA 和 OPENCL 之间的区别。我意识到 OpenCL 规范允许程序员以计算设备为目标(因此无论 GPU/CPU 架构如何),但 CUDA C 方法没有这样的抽象,因为它始终以兼容的 Nvidia GPU 架构为目标。所以我想知道如果我在 CUDA 环境中使用 Nvidia 的实现编写一个 OPENCL 内核,我还能以 CPU 为目标吗?据我了解,AMD Stream 环境允许您通过他们的 OpenCL 实现来做到这一点。

提前致谢。

0 投票
1 回答
3887 浏览

cuda - 带有 VDPAU 的 GStreamer(使用 nVidia 卡的 h264 加速)

我使用最新版本的 gstreamer 插件不好,我想尝试 VDPAU。我用搅拌机基金会的大钱兔子电影进行测试。我试过这个命令: gst-launch-0.10 filesrc=/home/alex/big.mp4 ! mp4mux ! vdpauh264dec ! vdpauvideopostprocess ! vdpausink但它无法将 mp4mux 与 vdph264dec 链接。

我还尝试使用 ffdemux_mov_mp4_m4a_3gp_3g2_mj2 而不是 mp4mux 和 gst-launch 失败但出现错误消息:

如何使用 NVIDIA 卡的 VDPAU 功能播放 h264?

在此先感谢您的帮助,请原谅我的英语不好。

问候,

0 投票
7 回答
6351 浏览

opencl - 用于 GPU 的 OpenCL FFT 库?

是否有任何通用 FFT 库可用于使用 OpenCL 在 GPU 上运行?据我所知,Apple 的二次幂 OpenCL FFT 示例代码是唯一可用的此类代码吗?

对于非二次幂变换大小,是否存在任何此类库?如果不是,修改 Apple OpenCL 示例的难易程度如何?

我正在研究具有非二次方变换大小的图像处理应用程序,我将不得不做一大堆 FFT,一个批处理 FFT。

0 投票
1 回答
833 浏览

amazon-ec2 - 使用新的 Amazon 的 EC2 集群 GPU 实例的体验如何?

Amazon 发布了 EC2 - Cluster GPU Instances,我想知道您对此有何体验?它是否稳定,在部署 CUDA 代码之前是否需要大量时间来安装新的驱动程序、SDK 等?

0 投票
1 回答
434 浏览

c# - HLSL 计算 - 按顺序处理像素?

想象一下,我想使用 GPU 计算斐波那契数列的前一百万项。(我意识到这将超过 32 位数据类型的精度限制 - 仅用作示例)

给定一个具有 40 个着色器/流处理器的 GPU,并使用参考书作弊,我可以将百万项分解为 40 个 250,000 个条带的块,并为每个着色器设置两个起始值:

单位 0:1,1(然后计算 2,3,5,8,blah blah blah)

单元 1:第 250,000 个学期

单元 2:第 500,000 个学期

...

如果可能的话,我怎样才能确保像素按顺序处理?如果输入纹理中的前几个像素有值(为简单起见,使用 RGBA)

如何确保在前四项准备好之前不尝试计算第五项?

我意识到这可以在多次传递中完成,但在计算值时设置一个“就绪”位,但这似乎非常低效,并且有点消除了在 GPU 上执行此类计算的好处。

OpenCL/CUDA/etc 可能提供了很好的方法来做到这一点,但我正在尝试(为了我自己的启发)让它与 XNA/HLSL 一起工作。

链接或示例表示赞赏。

更新/简化

是否可以编写一个使用一个像素的值来影响相邻像素的值的着色器?

0 投票
1 回答
12000 浏览

performance - GPU 上的整数计算

对于我的工作来说,进行整数计算特别有趣,这显然不是 GPU 的用途。我的问题是:现代 GPU 是否支持高效的整数运算?我意识到这对自己来说应该很容易弄清楚,但是我发现了相互矛盾的答案(例如yes vs no),所以我认为最好问一下。

此外,GPU 上是否有任何用于任意精度整数的库/技术?