我想使用云视觉来识别和隔离图片中的“主要”文本(例如包装上最大的文字)。我假设云视觉可以通过查看字体大小/每个字母占用多少像素来在后端做到这一点,但我不确定 API 中是否有输出。
我对此信息在文档中的最佳猜测是在以下链接中,但我看不到与此相关的任何内容:https ://cloud.google.com/natural-language/reference/rest/v1beta1/documents/注释文本
我想使用云视觉来识别和隔离图片中的“主要”文本(例如包装上最大的文字)。我假设云视觉可以通过查看字体大小/每个字母占用多少像素来在后端做到这一点,但我不确定 API 中是否有输出。
我对此信息在文档中的最佳猜测是在以下链接中,但我看不到与此相关的任何内容:https ://cloud.google.com/natural-language/reference/rest/v1beta1/documents/注释文本
TEXT_DETECTION
Vision API ( https://cloud.google.com/vision/docs/samples#detecting_text_in_images ) 可以返回 (string + boundingPoly) 的数组。
json 表示AnnotateImageResponse
如下。
"textAnnotations": [
{
object(EntityAnnotation)
}
]
EntityAnnotation
https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation
您可以从https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly获取字体大小(以像素为单位)BoundingPoly