5

我正在尝试使用 tensorflow 实现“深度卷积逆图形网络”,这意味着我必须对渐变做一些棘手的事情。

基本上,我想将一个自动编码器分成两个独立的网络。我不必这样做,但这会很方便。目的是在反向传播步骤中对梯度流动进行一些难以形容的修改。你有什么想法可以做到吗?这是我想要实现的架构: 在此处输入图像描述

很容易看出,对于正向路径,这意味着获取一个网络的输出并将其插入另一个网络。不幸的是,我看不到如何反向传播错误。

目前我最好的想法是复制权重矩阵之一,即将 W3 复制到编码器作为 W2.5,然后将 W3 的梯度复制为 W2.5 的梯度。但是在这个模式中必须有一个更简单的方法或一个明显的误解。

4

0 回答 0