我打算开发一个像Word Lens这样的应用程序。任何人都可以推荐一个我可以使用的好图书馆吗?或任何人解释 Word Lens 应用程序背后的技术?是卷轴时间图像匹配还是 OCR?我知道一些图像处理库,如 OpenCv、tesseract ......任何帮助都非常感谢......
问问题
5734 次
1 回答
42
我是 Word Lens 的创建者之一。虽然有一些 OCR 库(如 tesseract),但我们决定自己制作,以获得更好的结果和性能。我们的通用算法是这样的:
- 从相机复制图像并获取其灰度分量
- 平整图像,使文本在背景中清晰突出
- 在看起来像字符和句子的东西周围画框
- 进行 OCR:将每个框中的像素与字符数据库进行匹配——这实际上非常困难!
- 把字符收集成单词,查字典(这也很难,因为OCR会出错)
- 将结果绘制回图像上
图像匹配本身还不够好,因为字体、单词和语言种类繁多。
OpenCV 是一个很好的库,可以启动和运行,并总体上了解更多关于计算机视觉的信息。我建议建立他们的例子,并在那里玩。玩得开心!
于 2013-03-28T05:59:34.813 回答