image-processing - 谷歌视觉更好的 OCR 的理想图像尺寸是多少？

Question

我已经使用谷歌视觉 OCR 有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如，尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反过来会更糟。

我对微软的 OCR API 也有同样的体验。

那么是否有一个理想的图像尺寸总能提供良好的 OCR 结果？图像尺寸如何影响 OCR 结果？

score 1 · Accepted Answer

请在此处参考该信息：Google 支持的图片

FACE_DETECTION 1600 x 1200两眼距离最重要

LANDMARK_DETECTION 640 x 480

标识检测 640 x 480

标签检测640 x 480

TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更高的分辨率来检测字符

SAFE_SEARCH_DETECTION 640 x 480

score 0 · Accepted Answer

根据下面的链接，不仅分辨率，纵横比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api

2 回答 2