当我们尝试扫描包时,我们面临一个问题。主要原因是包包上刺绣的文字颜色与包包的颜色几乎相同。所以它不能扫描写在包上的确切文本。
为了得到实际的想法,我附上了图片。
在附图中,我们要扫描包的 ID(D1 150491)。让我知道我们是否需要付出额外的努力来扫描这种类型的图像。
注意:我们已经尝试了两个 SDK
正如对您问题的评论中所建议的那样,除了预处理您的图像之外,没有什么可以做的。Google Cloud Vision API(以及可能所有其他 OCR 平台)将无法识别文本,例如您在此图像中显示的文本。
为了提高对此类图像的识别,您应该应用一些预处理技术,其中您可以考虑(但不限于)评论中提到的那些:
简而言之,没有简单的方法可以做到这一点,您必须对图像进行预处理才能获得 Vision API 背后的模型可以真正理解的东西。
这张图片具有验证码级别的难度——你不能要求没有经过预训练的模型来识别它。
似乎这些角色松了一口气——如果我手里拿着这些袋子,我会寻找一种方法来实际拍摄这个照片,比如把袋子放在湿沙里。如果您事先知道每个位置上可能的格式和符号,那么您也很幸运。
我的任务不同 - 检测刻在金属表面上的非常微小的序列号。在我的情况下,对我帮助最大的基本上是两件事:1. 用手机拍摄照片并打开它的 LED。大幅增加对比度。2. 使用 CLAHE (Google it) 作为额外的对比度增强。它显着有助于 Google Vision OCR 识别。