tensorflow - 如何在多个 GPU 之间共享包含可变长度序列批次的队列？

Question

根据Tensorflow: Multi-GPU single input queue，让多个 GPU 共享一个队列可能会更好。该链接建议我们可以增加批量大小，然后自己拆分批次。但是，当输入数据是可变长度序列时，增加批量大小可能会导致许多零填充值。

例如，如果我们创建一个 4 序列批次并拆分批次，它可能是

/gpu:0

x, x, x, 0, 0, 0, 0, 0, 0
x, x, x, x, x, x, x, x, x

/gpu:1

x, x, 0, 0, 0, 0, 0, 0, 0
x, x, x, x, x, 0, 0, 0, 0

我的问题是：如何生产批次，例如：

/gpu:0

x, x, x, 0, 0, 0, 0, 0, 0
x, x, x, x, x, x, x, x, x

/gpu:1

x, x, 0, 0, 0
x, x, x, x, x

在slim之后，我尝试使用 atf.train.batch(data, batch_size=2, dynamic_pad=True)创建批处理，将批处理放入 a tf.PaddingFIFOQueue，然后调用tf.PaddingFIFOQueue.dequeue()不同的 GPU。但是，似乎所有 GPU 在最新的 tensorflow（master）上都获得了相同的数据。

以下代码演示了该问题：

import tensorflow as tf

capacity = 10
queue = tf.FIFOQueue(capacity, tf.int64)
enqueue = queue.enqueue_many((list(range(capacity)),))

def clone_fn():
    clone_data = queue.dequeue()
    return clone_data

num_gpus = 2
all_clones_data = []
for gpu_index in range(num_gpus):
    with tf.device('/gpu:{}'.format(gpu_index)):
        all_clones_data.append(clone_fn())

with tf.Session(config=tf.ConfigProto(allow_soft_placement=True)) as sess:
    sess.run(enqueue)
    print(sess.run(all_clones_data))

在最新的 tensorflow 上，输出为 [0, 0]

在较旧的 tensorflow (0.11) 上，输出是 [1, 0] ，这就是我想要的。

看起来很苗条还可以使用最新的 tensorflow 在所有 GPU 上获取相同的数据。

有没有更好的方法在多个 GPU 之间共享包含可变长度序列的队列？

score 1 · Accepted Answer

尝试运行

config = tf.ConfigProto(graph_options=tf.GraphOptions(optimizer_options=tf.OptimizerOptions(opt_level=tf.OptimizerOptions.L0)))

这有点违反直觉：提交7038

tensorflow - 如何在多个 GPU 之间共享包含可变长度序列批次的队列？

1 回答 1

Related

Reference