deep-learning - 主干在神经网络中意味着什么？

Question

我对神经网络中“主干”的含义感到困惑，尤其是在DeepLabv3+ 论文中。我做了一些研究，发现骨干可能意味着

网络的特征提取部分

DeepLabv3+ 以Xception和 ResNet-101 为骨干。但是，我对DeepLabv3+的整个结构并不熟悉，主干指的是哪一部分，哪些部分保持不变？

骨架的一般描述或定义也将被理解。

score 24 · Accepted Answer

在我的理解中，“骨干”指的是在 DeepLab 架构中使用的特征提取网络。该特征提取器用于将网络的输入编码为特定的特征表示。DeepLab 框架围绕这个特征提取器“包装”了一些功能。通过这样做，可以交换特征提取器，并且可以选择模型以在准确性、效率等方面适合手头的任务。

在 DeepLab 的情况下，主干一词可能指的是 ResNet、Xception、MobileNet 等模型。

score 21 · Accepted Answer

TL;DR Backbone 不是深度学习中的通用技术术语。

（免责声明：是的，可能有一种特定的方法、层、工具等被称为“骨干”，但一般不存在“神经网络的骨干”。）

如果作者在描述神经网络架构时使用“骨干”这个词，他们的意思是

特征提取（“看到”输入的网络的一部分），但这种解释在该领域并不十分普遍：例如，在我看来，计算机视觉研究人员会使用该术语来表示特征提取，而自然语言处理研究人员不会。
用非正式的语言来说，这部分问题对整个方法至关重要。

score 11 · Accepted Answer

Backbone 是 DeepLab 模型/论文中用来指代特征提取器网络的术语。这些特征提取器网络从输入图像中计算特征，然后通过 DeepLab 模型的简单解码器模块对这些特征进行上采样，以生成分段掩码。DeepLab 模型的作者展示了使用不同特征提取器（骨干网）如 MobileNet、ResNet 和 Xception 网络的性能。

score 5 · Accepted Answer

CNN 用于提取特征。有几种 CNN 可用，例如 AlexNet、VGGNet 和 ResNet（骨干网）。这些网络主要用于对象分类任务，并在一些广泛使用的基准和数据集（如 ImageNet）上进行了评估。在图像分类或图像识别中，分类器对图像中的单个对象进行分类，每张图像输出一个类别，并给出匹配一个类别的概率。而在对象检测中，模型必须能够识别单个图像中的多个对象并提供识别对象位置的坐标。这表明物体的检测可能比图像的分类更困难。

来源和更多信息：https ://link.springer.com/chapter/10.1007/978-3-030-51935-3_30

deep-learning - 主干在神经网络中意味着什么？

4 回答 4

Related

Reference