我正在尝试创建一个带有三重损失的连体网络,并且我正在使用 github 示例来帮助我。我对此相当陌生,我无法理解如何从模型中提取嵌入。下面是架构:
提取我在几页上找到的嵌入的代码是这样的:
def triplet_loss(y_true, y_pred):
anchor, positive, negative = y_pred[:,:emb_size], y_pred[:,emb_size:2*emb_size], y_pred[:,2*emb_size:]
positive_dist = tf.reduce_mean(tf.square(anchor - positive), axis=1)
negative_dist = tf.reduce_mean(tf.square(anchor - negative), axis=1)
return tf.maximum(positive_dist - negative_dist + alpha, 0.)
让我感到困惑的是我发现很难可视化矩阵,我不明白为什么锚是 y[:,:emb_size],正的是 y_pred[:,emb_size:2 emb_size] 和负的 y_pred[:,2 emb_size :]。
如果需要更多上下文,完整代码:https ://github.com/pranjalg2308/siamese_triplet_loss/blob/master/Siamese_With_Triplet_Loss.ipynb