问题标签 [gpgpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
45616 浏览

sdk - 如何获取 OpenCL SDK?

我正在阅读http://www.khronos.org/网站,只找到了 OpenCL 的标头(不是我不关心的 OpenGL)。如何获取 OpenCL SDK?

0 投票
2 回答
945 浏览

video - 这个GPU视频转码项目可行吗?

最近,一个想要使用 GPU 进行视频转码的人找到了我。他基本上希望我为他创建一个应用程序,他可以出售或从广告中获得收入。

现在他基本上已经让我告诉我5000美元的薪水我能做到什么。现在,我是一名研究生,我的期末论文基于使用 GPU 的进化算法获得了奖项。所以我知道 GPGPU 编程(这就是我们最初接触的原因),但我对视频压缩和转码等方面没有任何深入的了解。

所以我有点茫然,我想要这个项目,但我不想卖空自己,也不想承诺无法实现的事情。考虑到他想要一个类似于竞争对手的产品(badaboom、avivo),我想他们是一群比我更了解这个话题的人,我有点担心。

所以我想我的问题是,如果你处于我的境地,你会如何回应,你认为一个项目(编写基于 GPU 的视频转码器)对于像我这样有能力但不是该领域专家的人来说有多困难?

提前致谢

ps 他希望它是跨平台的

0 投票
4 回答
3153 浏览

multithreading - 为什么 CUDA 和 OpenCL 中的 GPU 线程在网格中分配?

我只是在学习OpenCL,我正处于尝试启动内核的时候。为什么 GPU 线程是在网格中管理的?

我将详细阅读有关此内容的更多信息,但如果有一个简单的解释会很好。使用GPGPU时总是这样吗?

0 投票
2 回答
5331 浏览

gpgpu - 在混合供应商的硬件上运行 OpenCL

我一直在玩他们 Stream 2.0 beta 中的 ATI OpenCL 实现。当前测试版中的 OpenCL 目前仅使用 CPU,下一个版本应该支持 GPU 内核。我下载了 Stream,因为我的工作机器中有一个 ATI GPU。

我编写的软件可以从使用 GPU 的收益中受益匪浅。然而,这个软件在客户机器上运行,我没有奢侈(就像许多科学计算环境一样)选择要开发的确切硬件,并为此进行优化。所以我的问题是,如果我将 ATI OpenCL 实现与我的应用程序一起分发,这是否意味着它将永远无法使用例如 NVidia 视频卡?如果我使用 NVidia OpenCL SDK,它永远不会在 AMD 芯片上以最佳方式运行(考虑到 ATI/AMD 链接)?

换句话说,最终谁负责提供 OpenCL 实现?用户是否能够为他们的 NVidia 视频卡安装一个 OpenCL“驱动程序”,以及一个为他们的 AMD CPU 提供最佳性能的“驱动程序”?

顺便说一句,除了 Khronos 留言板之外,还有什么好的/积极的 OpenCL 支持论坛,或者那是去的地方吗?我看到 ATI 有一块板,NVidia 大概也有自己的,OpenCL 用户/开发者社区在哪里闲逛?它是否已经合并到一个地方?

0 投票
3 回答
614 浏览

parallel-processing - 如何在多个 GPU 上扩展 Cholesky 分解

我已经实现了 Cholesky 分解,用于使用 ATI Stream SDK 在 GPU 上求解大型线性方程。现在我想利用越来越多的 GPU 的计算能力,我想在多个 GPU 上运行这段代码。

目前我安装了一台机器和一台 GPU,并且 cholesky 分解运行正常。我想为 N 台机器做这件事,并且都安装了一个 GPU。所以建议我应该如何进行。

0 投票
6 回答
976 浏览

language-agnostic - GPGPU 是黑客吗?

几天前我开始研究 GPGPU 并成功实现了具有良好性能的 cholesky 分解,我参加了一个关于高性能计算的会议,有人说“GPGPU 是一个黑客”。

我仍然很困惑这是什么意思以及他们为什么说它是黑客攻击。有人说这是 hack,因为您正在将问题转换为矩阵并对其进行操作。但是我仍然很困惑,人们是否认为这是一个黑客行为,或者如果是,那么为什么?

任何人都可以帮助我,为什么他们称它为黑客,而我没有发现任何问题。

0 投票
2 回答
990 浏览

parallel-processing - ubuntu 9.04 上的 ATI Stream SDK

我在 windows XP SP3 上使用了 ATI Stream SDK,并在 GPU 上实现了一种算法。但是现在我有兴趣在多台机器上的多个 GPU 上扩展这个算法,我切换到 UBUNTU 以使用 MPI(发送消息)。

我用谷歌搜索了这个,但我得到了在 SLES 和 RHEL 上安装的参考,但我正在寻找 UBUNTU 9.04。

谢谢GG

0 投票
4 回答
4904 浏览

math - GPU上的高精度数学

我对使用 HLSL 在 GPU 上实现算法很感兴趣,但我主要担心的一个问题是我想要一个可变的精度级别。是否有可以在 GPU 上实现的模拟 64 位精度和更高精度的技术。

谢谢!

0 投票
3 回答
3272 浏览

cuda - CUDA:nvcc 编译需要几分钟的原因是什么?

我有一些 CUDA 代码nvcc(嗯,技术上ptxas)喜欢花费 10 分钟以上的时间来编译。虽然它不小,但它肯定不是很大。(约 5000 行)。

延迟似乎在 CUDA 版本更新之间来来去去,但以前只需要一分钟左右而不是 10 分钟。

当我使用该-v选项时,在显示以下内容后似乎卡住了:

内核确实有一个相当大的参数列表和一个带有大量指针的结构,但我知道至少有一个时间点,几乎完全相同的代码在几秒钟内编译。

如果有帮助,我正在运行 64 位 Ubuntu 9.04。

有任何想法吗?

0 投票
4 回答
24378 浏览

compilation - 一个非常简单的 Makefile 应该如何在 linux 下编译 Cuda

我想在 Linux 下编译一个非常基本的 hello world 级别的 Cuda 程序。我有三个文件:

  • 内核:helloWorld.cu
  • 主要方法:helloWorld.cpp
  • 通用头文件:helloWorld.h

你能给我写一个简单的 Makefile 来用 nvcc 和 g++ 编译它吗?

谢谢,
加博尔