当我看到一些我不知道的关于 ATI 的统计数据时,我正准备购买 Nvidia GTX 470。
ATI 卡上的流在执行加密和解密所需的数学运算方面是否更好?
这场比赛我没有马;但作为一个尝试自己开发 GPGPU 并且知道其他许多人也在做同样事情的人,让我观察一下:
在 ATI 卡上接近峰值性能更加困难,因为您不仅必须将计算单元分解为非常多的计算核心,而且实际上还必须对许多核心中的每一个进行 4 路矢量化计算。对于像加密或 MD5 这样简单的事情,这可能很简单,但这是您必须经历的另一个步骤。
NVidia SDK 免费提供的开发工具(调试器和分析器,以及整个在线开发社区)比 ATI 提供的任何东西都更有用。说 OpenCL 就是 OpenCL 固然很好,但这并不能帮助您找到一个偷偷摸摸的错误或找出为什么您的占用率低于您认为的应有水平。那里有支持 ATI 的商业第三方产品,据我所知,这可能是有史以来最令人惊叹的工具,但它会花费你。
我在 NVIDIA 的 GPU 上进行 AES 并设法在 470 上实现近 100% 的占用率。我已经使用 OpenCL 玩了一段时间,它绝对不是你可以实现性能的东西。唯一的好处是它的广泛接受度和 x86 支持,但如果您正在谈论获得性能,请选择 NVIDIA。
注意:如果这是您可以外包的东西,请给我发送电子邮件:salman@tunacode.com
如果问题不是关于 MD5 散列的 CUDA 与 openCL(因为这不是关于卡,而是你用来实现问题的 api),那么从我在加密货币中看到的情况来看,ATI 硬件更适合散列算法(openCL实现)
如果我没记错的话,md5 哈希性能与 SHA-256 相同,因此您可以在(Hashes/sec)
此处查看每张卡的哈希性能列表:
请注意,这是取自基于 scrypt 的散列的莱特币,但每张卡的最大散列能力大致相同,只是散列算法改变了计算的难度。