问题标签 [gpgpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - 请推荐用于GPU编程的显卡
我正在寻找用于试验 GPU 编程的显卡的推荐。我更倾向于 OpenCL 而不是 CUDA。还要寻找价格合理的卡(有 50 美元或更低的卡吗?)
algorithm - CUDA 高效多边形填充算法
我需要有效的填充算法来填充封闭的多边形(例如扫描线填充),我可以在 CUDA 上运行它。你有什么建议吗?
提前感谢任何重播!
c - 在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(汽车、人)的工作代码示例?
我在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(计算机视觉的一部分)的工作代码?非常感谢提前。
opencl - 是否可以将 OpenCL 用于 PowerVR SGX530 GPU 设备?
是否可以将 OpenCL 用于 PowerVR SGX530 GPU 设备?我必须编写可以在 Droid X 智能手机上运行的图像识别软件。如果有人可以提供链接、参考、引用、示例代码,我将不胜感激。
cuda - 在使用 CUDA 工具包 OpenCL sdk 进行开发时,我可以通过 OpenCL 以 CPU 为目标吗?
我是 GPGPU 概念的新手,在过去的几个月里,我一直在慢慢地自学 CUDA 和 OPENCL 之间的区别。我意识到 OpenCL 规范允许程序员以计算设备为目标(因此无论 GPU/CPU 架构如何),但 CUDA C 方法没有这样的抽象,因为它始终以兼容的 Nvidia GPU 架构为目标。所以我想知道如果我在 CUDA 环境中使用 Nvidia 的实现编写一个 OPENCL 内核,我还能以 CPU 为目标吗?据我了解,AMD Stream 环境允许您通过他们的 OpenCL 实现来做到这一点。
提前致谢。
cuda - 带有 VDPAU 的 GStreamer(使用 nVidia 卡的 h264 加速)
我使用最新版本的 gstreamer 插件不好,我想尝试 VDPAU。我用搅拌机基金会的大钱兔子电影进行测试。我试过这个命令:
gst-launch-0.10 filesrc=/home/alex/big.mp4 ! mp4mux ! vdpauh264dec ! vdpauvideopostprocess ! vdpausink
但它无法将 mp4mux 与 vdph264dec 链接。
我还尝试使用 ffdemux_mov_mp4_m4a_3gp_3g2_mj2 而不是 mp4mux 和 gst-launch 失败但出现错误消息:
如何使用 NVIDIA 卡的 VDPAU 功能播放 h264?
在此先感谢您的帮助,请原谅我的英语不好。
问候,
opencl - 用于 GPU 的 OpenCL FFT 库?
是否有任何通用 FFT 库可用于使用 OpenCL 在 GPU 上运行?据我所知,Apple 的二次幂 OpenCL FFT 示例代码是唯一可用的此类代码吗?
对于非二次幂变换大小,是否存在任何此类库?如果不是,修改 Apple OpenCL 示例的难易程度如何?
我正在研究具有非二次方变换大小的图像处理应用程序,我将不得不做一大堆 FFT,一个批处理 FFT。
amazon-ec2 - 使用新的 Amazon 的 EC2 集群 GPU 实例的体验如何?
Amazon 发布了 EC2 - Cluster GPU Instances,我想知道您对此有何体验?它是否稳定,在部署 CUDA 代码之前是否需要大量时间来安装新的驱动程序、SDK 等?
c# - HLSL 计算 - 按顺序处理像素?
想象一下,我想使用 GPU 计算斐波那契数列的前一百万项。(我意识到这将超过 32 位数据类型的精度限制 - 仅用作示例)
给定一个具有 40 个着色器/流处理器的 GPU,并使用参考书作弊,我可以将百万项分解为 40 个 250,000 个条带的块,并为每个着色器设置两个起始值:
单位 0:1,1(然后计算 2,3,5,8,blah blah blah)
单元 1:第 250,000 个学期
单元 2:第 500,000 个学期
...
如果可能的话,我怎样才能确保像素按顺序处理?如果输入纹理中的前几个像素有值(为简单起见,使用 RGBA)
如何确保在前四项准备好之前不尝试计算第五项?
我意识到这可以在多次传递中完成,但在计算值时设置一个“就绪”位,但这似乎非常低效,并且有点消除了在 GPU 上执行此类计算的好处。
OpenCL/CUDA/etc 可能提供了很好的方法来做到这一点,但我正在尝试(为了我自己的启发)让它与 XNA/HLSL 一起工作。
链接或示例表示赞赏。
更新/简化
是否可以编写一个使用一个像素的值来影响相邻像素的值的着色器?