deep-learning - 为什么无监督模型需要实现 nn.diag？

Question

我正在努力学习深度学习。

在火炬教程中，

https://github.com/torch/tutorials/blob/master/2_supervised/2_model.lua

https://github.com/torch/tutorials/blob/master/3_unsupervised/2_models.lua

监督模型

-- Simple 2-layer neural network, with tanh hidden units
model = nn.Sequential()
model:add(nn.Reshape(ninputs))
model:add(nn.Linear(ninputs,nhiddens))
model:add(nn.Tanh())
model:add(nn.Linear(nhiddens,noutputs))

无监督模型

-- encoder
encoder = nn.Sequential()
encoder:add(nn.Linear(inputSize,outputSize))
encoder:add(nn.Tanh())
encoder:add(nn.Diag(outputSize))
-- decoder
decoder = nn.Sequential()
decoder:add(nn.Linear(outputSize,inputSize))
-- complete model
module = unsup.AutoEncoder(encoder, decoder, params.beta)

为什么无监督模型需要实现 nn.Diag ？

提前致谢。

score 0 · Accepted Answer

它实际上是可学习向量（矩阵的对角线）的缩放。这在Learning Fast Approximations of Sparse Coding论文的第 3.1 节中提到。它乘以 tanh 并一起形成非线性。

deep-learning - 为什么无监督模型需要实现 nn.diag？

1 回答 1

Related

Reference