1

当我们尝试扫描包时,我们面临一个问题。主要原因是包包上刺绣的文字颜色与包包的颜色几乎相同。所以它不能扫描写在包上的确切文本。

为了得到实际的想法,我附上了图片。

在附图中,我们要扫描包的 ID(D1 150491)。让我知道我们是否需要付出额外的努力来扫描这种类型的图像。

注意:我们已经尝试了两个 SDK

在此处输入图像描述

4

3 回答 3

1

正如对您问题的评论中所建议的那样,除了预处理您的图像之外,没有什么可以做的。Google Cloud Vision API(以及可能所有其他 OCR 平台)将无法识别文本,例如您在此图像中显示的文本。

为了提高对此类图像的识别,您应该应用一些预处理技术,其中您可以考虑(但不限于)评论中提到的那些:

  • 应用过滤器:边缘检测,使用一些流行的方法,例如 Canny 或 Sobel(这里有一些示例)。
  • 图像二值化:包括在图像的灰度级中设置阈值,使背景具有一种颜色(白色或黑色),而字母具有另一种颜色。您可以在此处查看一些示例,尽管我认为这不适用于您的情况,因为字母的灰度级和图像的其余部分看起来非常相似(由于字母中只有一点点亮度它的体积)。
  • 玩转:改变图像的亮度和对比度,你可能会得到一些结果。然而,这个过程很难自动化,并且相同的值可能不适用于不同的图像。

简而言之,没有简单的方法可以做到这一点,您必须对图像进行预处理才能获得 Vision API 背后的模型可以真正理解的东西。

于 2018-02-16T15:34:00.773 回答
0

这张图片具有验证码级别的难度——你不能要求没有经过预训练的模型来识别它。

似乎这些角色松了一口气——如果我手里拿着这些袋子,我会寻找一种方法来实际拍摄这个照片,比如把袋子放在湿沙里。如果您事先知道每个位置上可能的格式和符号,那么您也很幸运。

于 2018-02-17T14:56:37.633 回答
0

我的任务不同 - 检测刻在金属表面上的非常微小的序列号。在我的情况下,对我帮助最大的基本上是两件事:1. 用手机拍摄照片并打开它的 LED。大幅增加对比度。2. 使用 CLAHE (Google it) 作为额外的对比度增强。它显着有助于 Google Vision OCR 识别。

于 2018-06-12T05:52:45.293 回答