问题标签 [tesla]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - 用于 CUDA 编程的 Nvidia Tesla 与 480
我正在研究 CUDA 编程。
我可以选择购买单个 NVidia Tesla 还是购买大约 4-5 个 NVidia 480?
你有什么建议吗?
multithreading - NVIDIA Tesla 上的线程总数
可以在 nvidia Tesla 上同时运行的线程总数是多少,比如 S1070。
directx - Tesla 适配器上的 CUDA 和另一个 NVIDIA 适配器上的全屏 DX 窗口
我有一个应用程序在 Tesla X2050 适配器上使用 CUDA 进行一些处理。在我的系统中,我还有一个 Qudaro4000,应用程序不为此目的使用它。此外,我还有另一个 Geforce2xx 显卡,用于显示图案。显示图案的部分只是在 GeForce2xx 适配器上创建全屏 DX9 设备并在每个显示帧显示不同图案的代码。为此,它需要将其显示为 VSynched,并且不应跳过或错过任何模式。我遇到的问题是,当我打开 VSync 时,所有的 CUDA 处理都变得非常缓慢。如果我禁用 VSynch,那么我会在不需要的模式中撕裂。如何将 CUDA 处理和模式显示结合起来?为了上下文,
编辑 10.4.2011:我发现了为什么序列可以完美地投影在一台计算机上,以及为什么图像在更强大的计算机中时不时停止。不同之处在于一个有一个板载英特尔 GPU,一个有 3 个 NVIDIA GPU。好吧,对于这个特定的任务,板载的英特尔 GPU 比任何 NVIDIA GPU 都做得更好。这可能是因为不同的驱动程序,我正在寻找是否有任何类型的选项\参数组合可以在 NVIDIA 驱动程序中设置以具有与英特尔 GPU 相同的完美性能。
谢谢你。
提供。
cuda - NVidia CUDA:Tesla T10处理器和Tesla M2090处理器的区别
我有一个执行有限差分计算的 CUDA 代码。该代码在 Tesla M2090 处理器上运行良好,没有错误。相同的代码会导致 Tesla T10 处理器出现大量错误。我的结果中有很多零。
有谁知道这两种架构之间的区别以及如何解决问题的解决方案
mysql - 用于 Web 服务器的基于 Tesla 的服务器?
我只是想知道我是否可以像普通服务器一样使用基于特斯拉的服务器(需要明确的是特斯拉 GPU)作为 Web 服务器,例如通过安装 apache 和 mysql?
如果可能的话,我想知道它是否会有效地利用 Tesla GPU 的能力,做与 CPU 几乎相同的工作??
谢谢您的回答 :)
opencl - nVidia Tesla 卡有什么好处吗?
我打算购买一个严肃的 GPU 来运行并行算法(预算 2k-4k)。现在,我到处都能看到采用“专为 GPGPU 制造”的 nVidia Tesla GPU 卡的超级计算机。
虽然乍一看这似乎非常好,但更好的阅读让我对此产生了认真的思考:与例如 Radeon HD 7970 相比,它的性能(就触发器而言)要低得多,成本要高得多,而且我似乎无法在 Tesla 和普通游戏 GPU 之间找到任何基准比较。
我发现特斯拉具有 ECC 内存。这是唯一的区别吗?还是我错过了两者之间更深层次的架构差异?也许相关信息:我将使用 OpenCL,而不是 Cuda。
cuda - 费米架构可能解决我的比较研究?
我正在进行一项比较研究,其中我必须对算法的串行和并行版本进行比较(NSGA-II 算法是精确的下载链接)。NSGA-II 是一种启发式优化方法,因此取决于生成的初始随机种群。如果使用 CPU 和 GPU 生成的初始种群不同,那么我无法进行公正的加速研究。
我拥有一块计算能力为 1.3 的 NVIDIA-TESLA-C1060 卡。根据这个答案和这个 NVIDIA 文档,我们不能指望 sm_13 设备总是产生符合 IEEE-754 的浮点(单精度)值。换句话说,这意味着在我当前的设备上,我无法对其串行对应的 CUDA 程序进行公正的加速研究。
我的问题是:改用 Fermi 架构能解决问题吗?
cuda - 用 sm_20 得到 nan
我正在使用特斯拉 C2050。我想用“-arch=sm_20”运行我的代码,但我得到-nan,而使用“-arch=sm_13”的计算是正确的?!我应该找出什么问题?
谢谢,贝扎德
gpu - 特斯拉相对于 GeForce 的优势
我已经阅读了一些我可以在互联网上找到的关于这两个系列卡片之间差异的信息,但我不禁觉得它们在某种程度上是广告。虽然最强大的 GeForce 价格约为 700 美元,但特斯拉的起价约为 2500 美元,相差很大。
虽然列出的最大优势之间的 ECC 内存很有趣,但我怀疑它是否解释了这种差异。第二个最突出的事情是双精度数字的性能要好得多,但我将主要关注整数运算,所以这并不重要。顶级 GeForce 卡也有很多内存。虽然两个系列都使用 GDDR5,但 GeForce 显存带宽甚至高于特斯拉。
有没有人有客观比较这两个系列的个人经验?因为我认为特斯拉的大部分成本与高级工具和支持有关,而不是与它们的性能有关。
cuda - Cuda::Entry 函数使用过多的本地数据
我正在尝试为 Tesla C2075 上的多边形交集运行一种算法。但是当我尝试编译此算法时,编译器给了我错误:"Entry Function 'Polygon_Intersection'uses too much local data(0x40e8 bytes,0x4000)
。
我的算法有点复杂,它利用了内核中的大量局部变量。所以我的问题是,有没有办法解决这个问题,比如我可以使用全局内存为每个内核声明局部变量还是以某种方式使用共享内存?