我是并行编程的初学者。我有一个可能看起来很愚蠢的查询,但是当我用谷歌搜索它时,我没有得到明确的答案。
在 GPU 计算中,有一个设备即 GPU 和主机即 CPU。我写了一个简单的 hello world 程序,它将在 gpu 上分配一些内存,将两个参数(比如 src[] 和 dest[])传递给内核,复制 src 字符串,即 Hello world 到 dest 字符串并从 gpu 获取 dest 字符串到主人。
字符串“src”是由 GPU 读取还是 CPU 写入 GPU?此外,当我们从 GPU 取回字符串时,是 GPU 写入 CPU 还是 CPU 从 GPU 读取?
在来回传输数据时,可能有四种可能性 1. CPU 到 GPU - CPU 写入 GPU - GPU 从 CPU 读取 2. GPU 到 CPU - GPU 写入 CPU - CPU 从 GPU 读取
有人可以解释一下哪些是可能的,哪些是不可能的?