我想我们也许可以对一些执行多类别分类的方法进行 Caffeinated 描述。
多类别分类我的意思是:输入数据包含多个模型输出类别的表示和/或简单地在多个模型输出类别下可分类。
例如,包含猫和狗的图像将(理想情况下)为猫和狗预测类别输出 ~1,为所有其他类别输出 ~0。
根据这篇论文,这个陈旧封闭的 PR和这个开放的 PR,似乎 caffe 完全可以接受标签。这个对吗?
构建这样的网络是否需要使用多个神经元(内积 -> relu -> 内积)和 softmax 层,如本文第 13 页所示;还是 Caffe 的 ip & softmax 目前支持多个标签维度?
当我将标签传递给网络时,哪个示例可以说明正确的方法(如果不是两者)?:
例如 猫吃苹果注意:Python 语法,但我使用的是 c++ 源代码。
列 0 - 类在输入中;第 1 列 - 类不在输入中
[[1,0], # Apple [0,1], # Baseball [1,0], # Cat [0,1]] # Dog
或者
第 0 列 - 类在输入中
[[1], # Apple [0], # Baseball [1], # Cat [0]] # Dog
如果有任何不清楚的地方,请告诉我,我将生成我试图提出的问题的图片示例。