我对 CPU 和 GPU 之间差异的理解是 GPU 不是通用处理器,因此如果显卡包含 10 个 GPU,则每个 GPU 实际共享相同的程序指针并优化 GPU 上的并行性我需要确保每个 GPU实际运行相同的代码。
同步在同一张卡上不是问题,因为每个 GPU 在物理上是并行运行的,所以它们应该同时完成。
我的问题是,这如何在多张卡上工作?以它们运行的速度,硬件是否会在执行时间上产生细微的差异,以至于在一张卡上的一个 GPU 上的计算可能比在另一张卡上的另一个 GPU 上的相同计算结束得更快或更慢?
谢谢