在“Learning both Weights and Connections for Efficient Neural Networks”一文中,它根据一个标准缩小了神经网络的大小。然而,我发现这篇论文的所有实现并没有在物理上缩小模型的大小。他们只是将一些神经元的权重归零以获得相同的结果。但在物理上,模型的大小和推理时间不会改变。我想知道我怎么能在身体上做到这一点?
在“Learning both Weights and Connections for Efficient Neural Networks”一文中,它根据一个标准缩小了神经网络的大小。然而,我发现这篇论文的所有实现并没有在物理上缩小模型的大小。他们只是将一些神经元的权重归零以获得相同的结果。但在物理上,模型的大小和推理时间不会改变。我想知道我怎么能在身体上做到这一点?