朋友们!我有一个关于使用多个 gpu 进行处理的问题。我正在使用 4 gpus 并以如下 3 种方式尝试了简单的 A^n + B^n 示例。
单 GPU
with tf.device('/gpu:0'): ....tf.matpow codes...
多个 GPU
with tf.device('/gpu:0'): ....tf.matpow codes... with tf.device('/gpu:1'): ....tf.matpow codes...
没有指定特定的 gpu(我想可能所有的 gpu 都使用了)
....just tf.matpow codes...
当尝试这个时,结果是不可理解的。结果是 1.单个 gpu:6.x 秒 2.多个 gpu(2 gpus):2.x 秒 3.没有指定特定 gpu(可能是 4 gpus):4.x 秒
我不明白为什么#2 比#3 快。任何人都可以帮助我吗?
谢谢。