我有一个编码器解码器网络:编码器中有 3 个 BLSTM,解码器中有 2 个 vanilla LSTM,与 4 个节点的多头注意力连接。潜在维度是 32,我的总样本看起来像 (10000,400,128)。编码器网络的 dropout 为 0.2,解码器的 dropout 为 0.3。我正在使用学习率为 0.001 和均方误差损失的 adam 优化器。最后,我的验证拆分为 0.3。我在 Vast.ai 上租用了 Nvidia Titan V(具有 Core™ i9-9820X,5.0/20 个内核和 16/64 GB 总有效共享 RAM),当我一起训练时,每个 epoch 大约需要 6 分钟(7000 次训练和 3000 个验证样本)。
我希望找到减少总火车时间的方法。任何建议都会很棒。