0

我正在尝试在我的 Google Glass 应用程序中找到一种免费的方法来进行图像识别/计算机视觉。我正在寻找能够识别真实世界对象的东西,例如金钱、书籍封面和文本。理想情况下,它会像 Google Goggles 一样工作(出于某种原因,Google 没有制作 Goggle API)。我对基于云的解决方案或在本地运行的解决方案持开放态度。如果在 Glass 上本地进行图像识别不可行,我什至愿意运行自己的服务器。

我研究了几种不同的技术。OpenCV看起来非常强大,但它没有提供匹配的图像库。CamFind有一个云 API 可以完全满足我的需求,但它要花很多钱。

对于如何将图像识别添加到我的应用程序有什么建议吗?提前致谢!

4

2 回答 2

1

我在纽约市(2013 年)通过黑客攻击基本相同的东西赢得了 Glass Foundry 黑客马拉松。这是在 Glass 的原生开发工具包发布之前,所以我只使用镜像 API 完成了这一切。这就是我实现它的方式:

  1. 首先,使用快速入门之一创建一个服务器端 Glass 应用程序。请求正确的范围,以便您可以与 Mirror API 交互并操纵用户的时间线。
  2. 公开一个自定义的分享目标,这样当用户拍照时,他们可以与你的应用“分享”它
  3. 共享后,您的服务器将收到来自镜像 API 的带有图像的 POST(我相信是多部分的)注意:大多数图像识别不需要像 Glass 的 5mp 那样高分辨率,因此我将图像显着缩小以使一切移动得更快.
  4. 在服务器端,将图像上传到图像识别服务。我使用了现已失效的 IQ 引擎。快速的 Google 搜索会显示许多服务。
  5. 还是在服务器端,用图像识别的结果,插入一张新卡片到用户的时间轴上,结果和图像等
于 2014-10-06T02:40:49.363 回答
0

OpenCV 具有用于检测眼睛、身体和车牌号的 haarcascade。有关可用功能,请参阅以下链接。

https://github.com/Itseez/opencv/tree/master/data/haarcascades

有关眼睛检测,请参阅以下内容

Opencv - 检测眼睛是闭合还是睁开

于 2014-10-06T04:54:15.453 回答