0

我的 android 项目有用户 tesseract ocr 来识别从相机拍摄的图像中的文本。但结果并不准确。我想使用opencv优化图像。我想为以Bitmap.Config.ARGB_8888格式解码的捕获图像实现以下目标:

  1. 检测调整大小的图像中的对象。
  2. 一旦对象被识别,计算它的边界 wrt 原始图像。(这是为了去除相机角度效果)
  3. 通过应用透视变换从原始图像中提取对象。
  4. 应用白平衡以消除亮化效果。

在 tess_two api 提供的示例中,他们使用Leptonica进行图像处理,例如在单词周围绘制边界框。但在我的情况下,我想使用OpenCV ...您的指导将不胜感激...

4

1 回答 1

0

这是你要求的很多,并且取决于对象可能是不可能的。您应该查看有关 2D 特征检测和对象检测的教程(http://docs.opencv.org/doc/tutorials/features2d/table_of_content_features2d/table_of_content_features2d.htmlhttp://docs.opencv.org/doc/tutorials/ objdetect/table_of_content_objdetect/table_of_content_objdetect.html)看看是否有什么可以使用的。

白平衡对照明没有任何作用,您应该进行自适应阈值处理或某种高通滤波。

于 2013-04-21T09:15:50.520 回答