问题标签 [gpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - Performance differences between different CUDA SDK's?
If I want to re-write my application so that it leverages the power of nVidia's CUDA SDK, are there any differences at all in runtime performance between the different SDK offerings: C++, Java, Python?
Is there any difference at all between these 3 SDK's, besides the obvious language being used?
optimization - 密集使用矩阵乘法的处理数字或科学模拟应用程序
对于我的研究,我们有矩阵乘法的代码,大小在 1000-10000 之间。它看起来相当快,并且使用 GPU 进行计算。作为家庭作业,我们需要找到具有可用源代码的数字运算应用程序,其瓶颈在于矩阵乘法。我们将把程序与 GPU 代码连接起来,用于矩阵乘法和测量加速。
我的问题是 - 我在哪里可以找到有关此类应用程序的信息,或者您是否可以告诉我其中一些。即使是科学模拟代码也会有所帮助。我们的老师谈到了分子动力学和类似的东西,但我们是计算机科学专业的学生,没有这方面的经验。
非常感谢
cuda - CUDA:注入我自己的 PTX 函数?
我希望能够使用 PTX 1.3 中尚未在 C 接口中实现的功能。有没有办法在 PTX 中编写我自己的函数并注入到现有的二进制文件中?
我正在寻找的功能是获得价值%smid
parallel-processing - 开源并行编程 IDE 的建议
使用 CUDA / MPI 等进行编程的最佳 IDE / IDE 插件 / 工具等是什么?
我在这些框架中工作了一段时间,但感觉 IDE 在扩展和作业处理交互方面可能会做更多的工作。
(我通常使用 Eclipse 或 Netbeans,通常在 C/C++ 中偶尔使用 Java,这是一个模糊的问题,但我想不出更具体的方式来表达它)
algorithm - 是否可以在 GPU 中实现霍夫曼解码?
我们有一个用霍夫曼编码编码的数据库。这里的目的是在 GPU 上复制它及其相关的解码器;然后在 GPU 上,解码数据库并在这个解码的数据库上做一些事情,而不是在 CPU 上复制回来。
我远不是霍夫曼专家,但我知道的少数人表明它似乎是一种基本上基于控制结构的算法。有了基础算法,恐怕会出现很多序列化的操作。
我的两个问题是:
- 你知道是否存在任何用于霍夫曼编码的高效 GPU 版本
- 如果没有,您认为是否存在适用于 GPU 的 Huffman 算法(即控制结构较少)。或者您可能知道(并且您可以提供参考)高效的霍夫曼解码在 GPU 上效率不高。
我看到了其他限制,但它们并不重要: - GPU 无法非常有效地处理树:二叉树可以存储在经典数组中 - 工作负载可能难以平衡:我们稍后会看到
c - 如何在新的 MacBookPro 上以编程方式激活 nVidia 卡以进行 CUDA 编程?
新款 MacBookPro 配备两个图形适配器,英特尔高清显卡和 NVIDIA GeForce GT 330M。OS X 在它们之间来回切换,这取决于工作负载、外部监视器的检测或 Rosetta 的激活。
我想用 CUDA 编程让我的脚湿透,不幸的是 CUDA SDK 似乎并没有处理这种来回切换。当 Intel 处于活动状态时,不会检测到任何 CUDA 设备,而当 NVidia 卡处于活动状态时,它会被检测到。所以我目前的解决方法是使用小工具 gfxCardStatus ( http://codykrieger.com/gfxCardStatus/ ) 来强制打开或关闭卡,就像我需要它一样,但这并不令人满意。
这里有人知道 Apple 祝福的 Apple 推荐的方法是(1)检测 CUDA 卡的存在,(2)在存在时激活这张卡吗?
wpf - 使用 GPU 密集型应用程序时的 WPF/Silverlight 性能
我可能在这个问题上混合了苹果和橙子,因为我在提到的领域是菜鸟,所以请试着理解我的意思。
我读到 WPF(和 Silverlight,作为它的扩展)使用 GPU 加速在屏幕上呈现自身。
如果是这样,当我已经运行 GPU 密集型应用程序(例如,窗口模式下的游戏),然后运行需要一些 GPU 时间/功率的 WPF/Silverlight 应用程序时会发生什么?谁获得更大的优先权?他们都开始“口吃”了吗?
谢谢!
compilation - NVIDIA CUDA SDK 示例编译不支持的架构“compute_20”
在编译 CUDA SDK 时,我得到一个 nvcc 致命错误:不支持的 gpu 架构 'compute_20' 我的工具包是 2.3,在共享系统上(即不能真正升级),驱动程序版本也是 2.3,在 4 个 Tesla C1060s 上运行
如果有帮助,则在 radixsort 中调用了该问题。
似乎网上有几个人遇到了这个问题,但我还没有找到任何真正给出解决方案的地方。
cuda - 用于 CUDA 编程的 GPU 模拟器,无需硬件
问题:是否有 Geforce 卡的模拟器可以让我在没有实际硬件的情况下编程和测试 CUDA?
信息:
我希望在 CUDA 中加快我的一些模拟,但我的问题是我并不总是在我的桌面上进行这个开发。我想在我的上网本上做一些工作,但我的上网本没有 GPU。现在据我所知,您需要一个支持 CUDA 的 GPU 来运行 CUDA。有没有办法解决这个问题?似乎唯一的方法是使用 GPU 模拟器(这显然会非常缓慢,但可以工作)。但无论有什么方法可以做到这一点,我想听听。
我在 Ubuntu 10.04 LTS 上编程。
c++ - 向设备发送 char ** 数据类型
我有一个要发送到设备的字符指针数组。有人可以告诉我怎么做吗?
这是我到目前为止所尝试的:
如何将参数传递给上述两个函数?最后应该如何调用内核?(我只是通过 b 或 *b 还是什么?)