Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
为了在带有 CUDA 的 GPU 上使用数据并行算法,有两个标准库,CUDPP 和 Thrust,它们实现了排序、归约、前缀和等。
那么库之间在性能和功能方面的主要区别是什么?
大约一年前,我使用过排序和前缀总和(使用 CUDA 4.1,但我不记得 Thrust 和 CUDPP 的版本),我体验到 CUDPP 快一点但 Thrust 更易于使用(使用 float -array 大约有 20M 个条目)。
至于功能,据我所知,您还可以将 Thrust 与主机内存一起使用,不仅与设备内存一起使用(与 CUDPP 相反),但这可能已经过时了。