Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我很好奇:在 GPU 上,是否可以在几个时钟周期内并行添加数百万个数字 - 或者这个操作在理论上是不可能并行化的?
GPU 是指来自 nVidia 或 AMD 的任何产品,例如 Tesla M2050。
只有一个时钟周期,还是“几个”?如果是前者,那就不行,任何 GPU 中的硬件资源都远不足以在同一时钟周期内添加数百万个双精度数。如果您的意思是“相对于典型的 CPU,时钟周期相对较少”,那么可以。您希望执行的添加类型也是一个因素。例如,您是否对数组元素进行归约和?还是将两个向量相加?或者在向量中添加一个常数?这些都在 GPU 上具有不同的性能特征。