我已经使用谷歌视觉 OCR 有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如,尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反过来会更糟。
我对微软的 OCR API 也有同样的体验。
那么是否有一个理想的图像尺寸总能提供良好的 OCR 结果?图像尺寸如何影响 OCR 结果?
我已经使用谷歌视觉 OCR 有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如,尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反过来会更糟。
我对微软的 OCR API 也有同样的体验。
那么是否有一个理想的图像尺寸总能提供良好的 OCR 结果?图像尺寸如何影响 OCR 结果?
请在此处参考该信息:Google 支持的图片
FACE_DETECTION 1600 x 1200两眼距离最重要
LANDMARK_DETECTION 640 x 480
标识检测 640 x 480
标签检测640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更高的分辨率来检测字符
SAFE_SEARCH_DETECTION 640 x 480
根据下面的链接,不仅分辨率,纵横比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api