3

将输入数据传递给 PyTorch 中的线性(全连接层)时出现此错误:

matrices expected, got 4D, 2D tensors

我完全理解这个问题,因为输入数据的形状为 (N,C,H,W)(来自 Convolutional+MaxPool 层),其中:

  • N:数据样本
  • C:数据的渠道
  • H,W:高度和宽度

尽管如此,我还是希望 PyTorch 对数据表单进行“重塑”:

  • [ N , D1,...Dn] --> [ N, D] 其中 D = D1*D2*....Dn

我尝试重塑 Variable.data,但我读到不建议使用这种方法,因为渐变会保留以前的形状,而且通常你不应该改变 Variable.data 形状。

我很确定该框架有一个简单的解决方案,但我还没有找到。

有没有好的解决方案?

PD:全连接层的输入大小为 C * H * W

4

3 回答 3

6

在阅读了一些示例后,我找到了解决方案。以下是您如何在不打乱前向/后向传递流程的情况下做到这一点:

(_, C, H, W) = x.data.size()
x = x.view( -1 , C * H * W)
于 2017-06-04T18:36:38.583 回答
5

一个更通用的解决方案(无论 x 有多少维度都可以)是取除第一个维度大小之外的所有维度大小的乘积(“批量大小”):

n_features = np.prod(x.size()[1:])
x = x.view(-1, n_features)
于 2018-08-09T16:07:28.273 回答
1

保存批量大小并在展平中推断其他维度是很常见的:

batch_size = x.shape[0]
...
x = x.view(batch_size, -1)
于 2021-07-07T11:00:19.590 回答