美国有线电视新闻网是:
- 输入:2 图像 128x128:输入 1 和输入 2
- 输出:CNN 返回一个变换矩阵:
outLayer = Layers.Dense(3 * 2, activation=activations.linear,kernel_initializer="zeos",bias_initializer=output_bias)(d2)
在我之后:
- 附加 STN ( https://github.com/kevinzakka/spatial-transformer-network ) 用于翻译和旋转输入1。完整的网络是带有 STN 的 CNN。返回具有 32 个批次的图像 (128x128)
- 我的损失是输入2和输出(CNN)之间的MSE:目标错误注册。2 个图像之间的 MSE(输入 2 和输出)
网络必须找到变换矩阵,因为 input2 = output 我可以仅将 STN 用于平移和旋转 input1 吗?因为我对 val_loss 有问题(使用 tensorflow):
纪元 1/90 30/30 [===============================] - 81s 3s/step - loss: 16.0190 - val_loss : 24.3248
纪元 2/90 30/30 [===============================] - 79s 3s/step - loss: 13.9868 - val_loss : 21.4465
时期 3/90 30/30 [===============================] - 73s 2s/步 - 损失:13.2970 - val_loss : 21.3151
纪元 4/90 30/30 [==============================] - 69s 2s/步 - 损失:12.9244 - val_loss : 21.6154
时代 5/90 30/30 [===============================] - 67s 2s/步 - 损失:12.6868 - val_loss : 20.0113
时期 6/90 30/30 [===============================] - 66s 2s/step - loss: 12.4998 - val_loss : 20.8911
纪元 7/90 30/30 [===============================] - 69s 2s/step - loss: 12.3066 - val_loss : 21.4276
纪元 8/90 30/30 [===============================] - 67s 2s/步 - 损失:12.1034 - val_loss : 21.3593
纪元 9/90 30/30 [===============================] - 69s 2s/步 - 损失:11.7645 - val_loss : 20.8941
纪元 10/90 30/30 [===============================] - 67s 2s/step - loss: 11.6544 - val_loss : 20.4768
纪元 11/90 30/30 [===============================] - 70s 2s/step - loss: 11.5483 - val_loss : 21.7420
纪元 12/90 30/30 [===============================] - 68s 2s/step - loss: 11.5680 - val_loss : 19.4531