在Watson Image Recognition (IR) 演示中,您可以给应用一个图像,它会对其进行分类,并告诉您它认为图像中的内容。它是如何做到这一点的?
据我从文档中可以看出,你只能给它正面和负面的图像,它只能说“是”,这是披萨,或者“不”,这不是披萨。它无法指定是披萨还是意大利面。
有没有办法可以做到这一点?
在Watson Image Recognition (IR) 演示中,您可以给应用一个图像,它会对其进行分类,并告诉您它认为图像中的内容。它是如何做到这一点的?
据我从文档中可以看出,你只能给它正面和负面的图像,它只能说“是”,这是披萨,或者“不”,这不是披萨。它无法指定是披萨还是意大利面。
有没有办法可以做到这一点?
该服务通过使用分类器的集合来工作;每个分类器仅适用于单个标签,并且必须使用自己的正负图像集进行训练。要获得比萨和意大利面,您必须创建两个分类器并使用正面和负面图像训练每个分类器。(然而,在这种特殊情况下,披萨的负面形象可能只是意大利面的正面形象,反之亦然。)
有一个可用的默认分类器集合,具有相当广泛的标签,所有这些都以这种方式训练过;我相信该演示使用了该默认集合 + AlchemyVision的组合(具有更广泛的分类,但不可训练)。您可以在 github 上查看演示的源代码。
您可以在 Visual Recognition 服务文档中阅读更多内容:http: //www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/visual-recognition/index.shtml