我使用约 5000 个我自己的特定领域图像和一组约 30 个分层和非分层标签构建了一个 Azure 自定义视觉模型。
我不确定在这个特定的多标签分类问题中如何最好地组织我的标签动物园。最好的方法(参见例如https://www.researchgate.net/publication/225379571_A_Tutorial_on_Multi-label_Classification_Techniques和https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff)必须依赖关于自定义视觉的内部运作,唉,无证*。考虑例如
Image Document_Description
1 Barclays Bank Statement
2 HSBC Bank Statement
3 Joe Bloggs' Curriculum Vitae
鉴于 Custom Vision 使用的(可能)未知建模方案及其对任意标签的支持,哪种标签分类最有效(在训练计算和模型性能方面)?
1. Hierarchical (choose one from each level):
IsCV | IsBankStatement | IsOther | ...
|
Barclays | HSBC | ...
2. Non-hierarchical:
IsCV, IsBankStatementBarclays, IsBankStatementHSBC, IsOther, ...
3. Both
4. Some other scheme perhaps informed by insider information?
奖励:您将如何使用可用的性能指标 - 或 V3.0 API - 来衡量两个竞争分类法的性能(以最少的训练计算/成本)?
*我为这个绝望的问题道歉。在投票关闭它之前,请允许 Azure 认知服务有时间发表评论,因为这似乎是他们可能能够提供意见的唯一论坛,并且他们确实通过 SO 要求查询。谢谢。