我一直在使用 Google Vision API,但我有一个无法真正解决的问题。这是我正在处理的图像:
在上图中,Google Vision API(也发生在IBM (Watson)和 Microsft (Cognitive Services)中)不理解 2,99€ 是可读的,因为它没有被视为单行,所以输出全部但我期望他做什么(了解标签的价格)。
如果我使用的是 Tesseract,我会通过使用该-psm 7
选项来解决这个问题,以便强制它作为单个文本行读取,但我无法使用 Google Vision API 找到这种情况的文档。
有没有人做过类似的事情?我无法弄清楚如何解决这个问题......