我已经为分类(每张图像的平均预测数)或语义分割(每像素的平均预测数)创建了一个集成,但我真的不知道如何进行对象检测。我的猜测是提取我所有网络的所有区域建议,然后在其中的X个上运行我的分类器,最后对所有边界框的预测进行平均。但是我应该如何使用遵循对象检测 API的架构来做到这一点?
我想可以使用 提取区域提案extract_proposal_features
,然后重新插入模型,但我认为这样做的唯一方法是使用自己的predict
方法等创建一个完整的新模型,处理我的 Ensemble 的所有模型。我是否错过了其他明显/更简单的方法?