我有一个使用 Google Vision API DOCUMENT_TEXT_DETECTION 来从文档图像中提取文本的项目。
API 通常无法识别单个数字,如下图所示:
我想这个问题可能与一些去除噪声的算法有关,它将孤立的单个数字识别为噪声。有没有办法在这些情况下改善视力反应?(例如管理噪声阈值或其他参数)
在其他时候,Vision 将数字与字母混淆:
但是如果我指定参数 languageHints = 'en' 或 'mt' 这些数字会被 ocr 忽略。有没有办法强制识别数字或拉丁字符?