ocr - Google Vision API - 我们能否在检测文档文本中包含自定义预处理逻辑并将其直接用作 Vision API

Question

我正在使用 Google Vision API 从我的图像中获取所有文本。但是，我只想通过调整图像大小来提取图像上特定区域的文本，而不是提取整个文本。然而，对于所有图像，该区域并未定义为固定坐标；这些图像是错误屏幕截图，其中消息可能位于任何一侧，有时屏幕截图是通过在显示器上打开多个窗口来拍摄的。我想使用自定义逻辑首先处理图像以识别可能存在错误消息的部分并仅分割该部分，然后传递图像的该部分以进行文本提取。但是我不想在 Vision API 之外有任何预处理逻辑。

score 0 · Accepted Answer

答案很简短：没有

google vision test-detection API 非常简短，不提供任何方法来满足您的要求。

ocr - Google Vision API - 我们能否在检测文档文本中包含自定义预处理逻辑并将其直接用作 Vision API

1 回答 1

Related

Reference