3

我有以下 NN 架构:

第1部分:

nn.Sequential {
  [input -> (1) -> (2) -> (3) -> (4) -> (5) -> (6) -> (7) -> output]
  (1): nn.TemporalConvolution
  (2): nn.TemporalMaxPooling
  (3): nn.TemporalConvolution
  (4): nn.TemporalMaxPooling
  (5): nn.Reshape(14336)
  (6): nn.Dropout(0.500000)
  (7): nn.Linear(14336 -> 128)
}

第2部分:

nn.Sequential {
  [input -> (1) -> (2) -> (3) -> output]
  (1): nn.Linear(4 -> 8)
  (2): nn.ReLU
  (3): nn.Linear(8 -> 4)
}

我想做的是使用这两个部分的输出作为另一部分的输入:

nn.Sequential {
  [input -> (1) -> (2) -> (3) -> (4) -> (5) -> (6) -> output]
  (1): nn.Linear(132 -> 32)
  (2): nn.ReLU
  (3): nn.Linear(32 -> 32)
  (4): nn.ReLU
  (5): nn.Linear(32 -> 2)
  (6): nn.LogSoftMax
}

注意第 1 部分有 128 个输出,第 2 部分有 4 个,最后第 3 部分有 132 个输入。所以基本上我想要的是一个接受两种类型输入的网络(第 1 部分用于文本,第 2 部分用于数字向量)并在第三层中使用这些信息进行 2 类分类。

我查看了各种容器,但似乎没有什么是我需要的。具体来说,我查看了 nn.Parallel 但从文档看来它做了一些完全不同的事情(两个不同模块的相同输入)。第一个问题是网络的输入应该是什么样子(因为每个部分都采用不同类型的张量,我认为一个简单的表(数组)就可以了,它的第一个元素是 2D 张量,第二个元素是 1D 张量) 以及如何将其输出插入另一个网络,以便我可以像往常一样使用前向/后向调用。

有什么办法可以做到这一点?

谢谢!

4

1 回答 1

5

您需要的是nn.ParallelTablenn.JoinTable

local parallel = nn.ParallelTable()
parallel:add(part1)
parallel:add(part2)

local net = nn.Sequential()
net:add(parallel)                   -- (A)
net:add(nn.JoinTable(1))            -- (B)
net:add(part3)                      -- (C)

(一个):

parallel将采用一个包含 2 个张量的表(在您的情况下是文本和数字),将第一个张量转发到part1,将第二个张量转发到part2并将两个结果输出到另一个包含 2 个张量的表中。

(乙):

下面nn.JoinTable将此表作为输入,并将 2 个张量连接到一个张量中。1根据张量的形状,您可能必须使用处理连接维度的参数(在我的示例中)。

(C):

最后,您可以添加网络的第三部分,将级联张量作为输入。

于 2015-09-17T16:59:30.807 回答