android - 当背景颜色和文本颜色几乎相似时，OCR 不起作用

Question

当我们尝试扫描包时，我们面临一个问题。主要原因是包包上刺绣的文字颜色与包包的颜色几乎相同。所以它不能扫描写在包上的确切文本。

为了得到实际的想法，我附上了图片。

在附图中，我们要扫描包的 ID（D1 150491）。让我知道我们是否需要付出额外的努力来扫描这种类型的图像。

注意：我们已经尝试了两个 SDK

score 1 · Accepted Answer

正如对您问题的评论中所建议的那样，除了预处理您的图像之外，没有什么可以做的。Google Cloud Vision API（以及可能所有其他 OCR 平台）将无法识别文本，例如您在此图像中显示的文本。

为了提高对此类图像的识别，您应该应用一些预处理技术，其中您可以考虑（但不限于）评论中提到的那些：

应用过滤器：边缘检测，使用一些流行的方法，例如 Canny 或 Sobel（这里有一些示例）。
图像二值化：包括在图像的灰度级中设置阈值，使背景具有一种颜色（白色或黑色），而字母具有另一种颜色。您可以在此处查看一些示例，尽管我认为这不适用于您的情况，因为字母的灰度级和图像的其余部分看起来非常相似（由于字母中只有一点点亮度它的体积）。
玩转：改变图像的亮度和对比度，你可能会得到一些结果。然而，这个过程很难自动化，并且相同的值可能不适用于不同的图像。

简而言之，没有简单的方法可以做到这一点，您必须对图像进行预处理才能获得 Vision API 背后的模型可以真正理解的东西。

score 0 · Accepted Answer

这张图片具有验证码级别的难度——你不能要求没有经过预训练的模型来识别它。

似乎这些角色松了一口气——如果我手里拿着这些袋子，我会寻找一种方法来实际拍摄这个照片，比如把袋子放在湿沙里。如果您事先知道每个位置上可能的格式和符号，那么您也很幸运。

score 0 · Accepted Answer

我的任务不同 - 检测刻在金属表面上的非常微小的序列号。在我的情况下，对我帮助最大的基本上是两件事：1. 用手机拍摄照片并打开它的 LED。大幅增加对比度。2. 使用 CLAHE (Google it) 作为额外的对比度增强。它显着有助于 Google Vision OCR 识别。

3 回答 3