3

我想使用云视觉来识别和隔离图片中的“主要”文本(例如包装上最大的文字)。我假设云视觉可以通过查看字体大小/每个字母占用多少像素来在后端做到这一点,但我不确定 API 中是否有输出。

我对此信息在文档中的最佳猜测是在以下链接中,但我看不到与此相关的任何内容:https ://cloud.google.com/natural-language/reference/rest/v1beta1/documents/注释文本

4

1 回答 1

1

TEXT_DETECTIONVision API ( https://cloud.google.com/vision/docs/samples#detecting_text_in_images ) 可以返回 (string + boundingPoly) 的数组。

json 表示AnnotateImageResponse如下。

"textAnnotations": [
    {
      object(EntityAnnotation)
    }
  ]

EntityAnnotation https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation

您可以从https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly获取字体大小(以像素为单位)BoundingPoly

于 2016-08-01T01:07:05.887 回答