在多层感知器小节下,文档说权重矩阵的维度为 m k。但是,我认为它应该是 k m,因为输出层-Y 的维度为 n * k。
我的理解正确吗?
一个层的正确矩阵计算公式FullyConnected
是:
output = input x weight_transpose + bias
所以在这个公式中,你的输入是n x m
,你的体重是k x m
在转置之前,你的输出是n x k
。在此处查看完全连接的 API 文档。
如果您刚刚开始,那么关注新的Gluon API可能是有意义的,它更容易学习和调试。