我正在使用 Google Vision API 从我的图像中获取所有文本。但是,我只想通过调整图像大小来提取图像上特定区域的文本,而不是提取整个文本。然而,对于所有图像,该区域并未定义为固定坐标;这些图像是错误屏幕截图,其中消息可能位于任何一侧,有时屏幕截图是通过在显示器上打开多个窗口来拍摄的。我想使用自定义逻辑首先处理图像以识别可能存在错误消息的部分并仅分割该部分,然后传递图像的该部分以进行文本提取。但是我不想在 Vision API 之外有任何预处理逻辑。
问问题
228 次