iphone - 实时图像处理 (OCR)

翻译自：https://stackoverflow.com/questions/15656331 2013-03-27T10:13:50.453

5734 次

15

我打算开发一个像Word Lens这样的应用程序。任何人都可以推荐一个我可以使用的好图书馆吗？或任何人解释 Word Lens 应用程序背后的技术？是卷轴时间图像匹配还是 OCR？我知道一些图像处理库，如 OpenCv、tesseract ......任何帮助都非常感谢......

1 回答 1

42

我是 Word Lens 的创建者之一。虽然有一些 OCR 库（如 tesseract），但我们决定自己制作，以获得更好的结果和性能。我们的通用算法是这样的：

从相机复制图像并获取其灰度分量
平整图像，使文本在背景中清晰突出
在看起来像字符和句子的东西周围画框
进行 OCR：将每个框中的像素与字符数据库进行匹配——这实际上非常困难！
把字符收集成单词，查字典（这也很难，因为OCR会出错）
将结果绘制回图像上

图像匹配本身还不够好，因为字体、单词和语言种类繁多。

OpenCV 是一个很好的库，可以启动和运行，并总体上了解更多关于计算机视觉的信息。我建议建立他们的例子，并在那里玩。玩得开心！

于 2013-03-28T05:59:34.813 回答