2

我想在 CUDA 中使用一个存在的函数,但它包含许多类和其他函数。__host__ __device__在每个函数之前添加是微不足道的。那么,有没有一种自动方法可以做到这一点?或者如何让 nvcc 将所有函数编译为__device__ __host__

4

1 回答 1

0

基本上,GPU 编程都是关于大规模并行性的。它与普通的单线程编程完全不同。除非您只想将这些函数同时应用于大型数组的各个元素,否则将其编码到 GPU 中没有任何好处。事实上,GPU 核心时钟比你的处理器慢得多。如果您将主要针对单线程风格的 CPU 编写的函数编译到 GPU,您将获得潜在的性能损失。您需要将您的问题重新考虑到 GPU 范式中。

于 2013-04-24T00:58:56.457 回答