2

我很好奇:在 GPU 上,是否可以在几个时钟周期内并行添加数百万个数字 - 或者这个操作在理论上是不可能并行化的?

GPU 是指来自 nVidia 或 AMD 的任何产品,例如 Tesla M2050。

4

1 回答 1

4

只有一个时钟周期,还是“几个”?如果是前者,那就不行,任何 GPU 中的硬件资源都远不足以在同一时钟周期内添加数百万个双精度数。如果您的意思是“相对于典型的 CPU,时钟周期相对较少”,那么可以。您希望执行的添加类型也是一个因素。例如,您是否对数组元素进行归约和?还是将两个向量相加?或者在向量中添加一个常数?这些都在 GPU 上具有不同的性能特征。

于 2012-05-30T14:38:27.833 回答