目前我正在尝试为 iPhone 创建一个应用程序,该应用程序能够识别图像上的对象,例如汽车、公共汽车、建筑物、桥梁、人等,并在 Internet 的帮助下标记为对象名称。
是否有任何免费服务可以解决我的问题,因为对象识别本身就是一个复杂的算法,需要数字图像处理、神经网络等等。
这可以通过API完成吗?
目前我正在尝试为 iPhone 创建一个应用程序,该应用程序能够识别图像上的对象,例如汽车、公共汽车、建筑物、桥梁、人等,并在 Internet 的帮助下标记为对象名称。
是否有任何免费服务可以解决我的问题,因为对象识别本身就是一个复杂的算法,需要数字图像处理、神经网络等等。
这可以通过API完成吗?
看看Cortexica。对这类事情非常有用。
如果您想识别平面图像,来自 Metaio、Qualcomm 和 Layar 的当前一代移动 AR SDK 将允许您上传要匹配的图像并执行匹配。
如果您想与一组 3D 对象自由匹配,例如 Toyota Prius 或 Empire state,可能会应用相同的技术来匹配以不同旋转拍摄的图像集,但您可能必须选择仅匹配一个对象由于您可以使用该服务拥有多大的图像数据库,或者联系这些公司以获得自定义解决方案,并且鉴于现有技术是可靠地与平面图像匹配,因此它可能无法非常可靠地工作。
如果你想识别一般类(人类、汽车、建筑),这是一个非常困难的问题,而且我不知道任何地方的任何解决方案都可以足够快地在线操作(我认为这是一个要求,因为你想要一个 AR 解决方案- 这是一个公平的假设吗?)。我学习 CV 已经有几年了,但当时最有希望的视觉分类解决方案是“视觉词袋”方法 - 你可以尝试阅读这些方法。