我想检测比只检测 80 个对象的 coco 数据集更多的对象,我想检测尽可能多的动作,比如拥抱、游泳......等等。
我不关心大小,我不想训练自己......那么是否有足够大的数据集(权重)可供我下载和使用,或者我必须为 yolo 训练和标记?
我想检测比只检测 80 个对象的 coco 数据集更多的对象,我想检测尽可能多的动作,比如拥抱、游泳......等等。
我不关心大小,我不想训练自己......那么是否有足够大的数据集(权重)可供我下载和使用,或者我必须为 yolo 训练和标记?
你可以在这里找到一个非常大的带有边界框的数据集!
您尝试分类的内容表示为动作识别。这里 [1] 是一个很好的存储库,它列出了许多用于此任务的开箱即用模型。
解释:模型(如 YOLO)包含两个主要模块:特征提取(CNN 的东西)和分类(线性层)。从头开始训练时,特征提取和分类都将从头开始训练。将分类训练到你想要的很容易,但很难训练特征提取部分(因为它需要很多时间)。因此,我们通常在泛化数据集上使用预训练模型(例如在 COCO 上训练 YOLO),因此我们的特征提取部分从一个比较好的泛化位置开始。稍后,我们替换分类部分将我们自己从头开始训练我们的任务。
TL;DR,您可以通过替换最后的线性层来对您想要的内容进行分类,从而在 COCO 上使用预训练的 YOLO 模型来完成您的任务。以下是不同框架的一些资源 [2, 3]。
这里 [4] 是如何做到这一点的简单演练。