问题标签 [gpgpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
190 浏览

gpgpu - 是否有支持 GPGPU 编程的显卡列表?

我的是“NVIDIA GeForce 9500 GS”,我搜索过的所有地方都只能找到“9500 GT”……这是否意味着 9500 GS 不支持任何 GPGPU 语言,例如 CUDA?

0 投票
2 回答
9871 浏览

c++ - 为什么我会收到 CL_MEM_OBJECT_ALLOCATION_FAILURE?

我在GPU上分配了一个 cl_mem 缓冲区并对其进行处理,它可以正常工作,直到超过某个大小。在这种情况下,分配本身会成功,但执行或复制不会。我确实想使用设备的内存来加快操作,所以我分配如下:

现在我不明白的是大小限制。我正在复制大约 16 MB,但应该能够使用大约 128 MB(请参阅 参考资料CL_DEVICE_MAX_MEM_ALLOC_SIZE)。

为什么这些数字相差如此之大?


以下是 oclDeviceQuery 的一些摘录:

0 投票
2 回答
682 浏览

xna - 从 XNA 上的后备缓冲区 (HLSL) 获取顶点

您好,抱歉标题晦涩:}我会尽力解释。

首先,我是 HLSL 的新手,但我了解来自童话世界的管道和东西。我想做的是使用 gpu 进行一般计算(GPGPU)。

我不知道的是:如何将顶点(已使用顶点着色器转换)读回我的 xna 应用程序?我读了一些关于使用 gpu 的纹理内存的东西,但我找不到任何可靠的东西......

提前感谢您提供任何信息/提示!:-)

*不确定是否可能是因为光栅化器和像素着色器(如果有的话),我的意思是,最终它都是关于像素的,对吧?

0 投票
1 回答
5239 浏览

c - 简单的 OpenCL 程序编译运行但输出不正确

我基于 SDK 编写了一个简单的 OpenCL 程序,它可以编译并运行,但是输出错误。有什么我做错了吗?

非常感谢任何有关学习调试 C 和 OpenCL 的建议。我对这个平台很陌生。

代码如下。

数组 c 中的输出全为零。

谢谢。

test_opencl.h

test_opencl.cl

test_opencl.cpp

0 投票
4 回答
4379 浏览

debugging - 如何调试 DirectX 11 计算着色器?

我已经开始使用DirectX 11 Compute Shader技术进行 GP-GPU 编程。我在 HLSL 上编写了一个相当复杂的程序,当我想调试它时,我意识到DX SDK 2009 年 8 月的PIX实用程序不支持计算着色器......我知道 Nvidia 将发布适用于 Visual Studio 的Nexus,它将支持直接计算调试,但仅限于尚未发布的下一代 NVidia GPU :( Compute Shader 技术对我来说非常有前途,因为设备独立性,但如果没有调试支持,它将很难使用。

您是否知道任何可用于 Compute Shader 调试的工具或方法,现在可用或计划在不久的将来发布?

0 投票
2 回答
740 浏览

iphone - 是否有任何适用于 iPhone 的 GPGPU 库?

是否有任何适用于 iPhone 的GPGPU库?

0 投票
4 回答
8680 浏览

delphi - 使用 Delphi 来利用 GPGPU 技术?

GPGPU 是在显卡上使用并行处理器以大幅提高性能的原理。

有没有人对在 Delphi 中使用 GPGPU,使用 OpenCL 或 CUDA 有任何想法?CUDA 只是 NVidia,但他们也采用了 OpenCL“标准”。

我从 Google 搜索中找到了一些 Delphi 示例,但它们要么崩溃,要么无法编译/运行。

最终的指令样本将是:

  1. 从这里下载并安装 OpenCL DLL。
  2. 从这里下载 OpenCL SDK。
  3. 从这里下载这个示例 Delphi 项目。
  4. 打开并编译 Delphi 项目。如果一切按计划进行,它将做“它应该做的任何事情”

在那个阶段,我可以开始研究 OpenCL SDK 并编写/编译 DLL 以从任何 Delphi 应用程序调用。

这种东西真的开始起飞了。Embarcadero 在这个阶段不需要自己做任何事情(除非他们愿意),但如果有 Delphi 的教程和示例可用,那就太好了。许多示例可用于其他语言,但我们还需要一个良好且简单的 Delphi 示例来展示将 Delphi 用于 GPGPU 应用程序是多么容易。

0 投票
1 回答
610 浏览

f# - Microsoft Accelerator V2 - toArray2D 问题

我是 Microsoft.Accelerator 的新手。看看下面的代码(它是 F#,但它类似于 C#):

基本上,我创建了一个 FPA 列表并以生成的 newfi 列表中的每个元素都依赖于 fi 列表中的所有元素的方式对其进行处理。最后我想得到结果 fi 列表。我的问题是:我应该为结果 FPA 列表中的每个元素 (FPA) 调用 toArray2D 吗?在我看来,每次调用 toArray2D 时都会运行整个计算,这非常耗时。

谢谢您的帮助。奥尔德里奇

0 投票
2 回答
5650 浏览

c++ - 如何在cuda中生成伪随机

我正在尝试使用 CUDA 构建一个粒子系统来完成繁重的工作。我想随机化一些粒子的初始值,比如速度和寿命。随机数不必是超级随机的,因为它只是为了视觉效果。我发现这篇文章涉及相同的主题:

CUDA 中的随机数生成

这表明线性同余是要走的路。看起来它应该很容易实现,但是我在实现任何有用的东西时遇到了麻烦。谁能提供一些将在设备中运行的代码?

我在 Windows 7 64 位上使用 CUDA 和 VC++。

0 投票
5 回答
15085 浏览

optimization - 减少 CUDA 内核中使用的寄存器数量

我有一个使用 17 个寄存器的内核,将其减少到 16 个会给我带来 100% 的占用率。我的问题是:有没有可以用来减少使用的数量或寄存器的方法,不包括以不同的方式完全重写我的算法。我一直认为编译器比我聪明得多,所以例如,为了清晰起见,我经常使用额外的变量。我的这种想法错了吗?

请注意:我确实知道 --max_registers (或任何语法)标志,但使用本地内存比降低 25% 的占用率更有害(我应该对此进行测试)