computer-vision - Yolov4 有更大的权重吗？

Question

我想检测比只检测 80 个对象的 coco 数据集更多的对象，我想检测尽可能多的动作，比如拥抱、游泳......等等。

我不关心大小，我不想训练自己......那么是否有足够大的数据集（权重）可供我下载和使用，或者我必须为 yolo 训练和标记？

score 2 · Accepted Answer

2

你可以在这里找到一个非常大的带有边界框的数据集！

于 2021-06-14T18:16:21.857 回答

score 0 · Accepted Answer

您尝试分类的内容表示为动作识别。这里 [1] 是一个很好的存储库，它列出了许多用于此任务的开箱即用模型。

解释：模型（如 YOLO）包含两个主要模块：特征提取（CNN 的东西）和分类（线性层）。从头开始训练时，特征提取和分类都将从头开始训练。将分类训练到你想要的很容易，但很难训练特征提取部分（因为它需要很多时间）。因此，我们通常在泛化数据集上使用预训练模型（例如在 COCO 上训练 YOLO），因此我们的特征提取部分从一个比较好的泛化位置开始。稍后，我们替换分类部分将我们自己从头开始训练我们的任务。

TL;DR，您可以通过替换最后的线性层来对您想要的内容进行分类，从而在 COCO 上使用预训练的 YOLO 模型来完成您的任务。以下是不同框架的一些资源 [2, 3]。

这里 [4] 是如何做到这一点的简单演练。

computer-vision - Yolov4 有更大的权重吗？

2 回答 2

Related

Reference