假设您有成千上万张猫的图像,如下所示:(https://web.archive.org/web/20150703060412/http://137.189.35.203/WebUI/CatDatabase/catData.html)。您希望构建一个可以查看图像并说出图像的系统 - 图像是否是猫的图像。
What are the (if any) techniques to build such a model with a descent accuracy?
PS1:这个问题的关键挑战是看到“不是猫的东西”是一个巨大的宇宙——这个世界上每一个不是猫的图像都符合它的资格。将此问题表述为二进制分类并不好,因为几乎不可能收集“什么不是猫”的“综合”数据集。(如果你这样做,你的模型将和你的“什么不是猫”的数据集一样好)
PS2:这样的设置叫做“一类分类”