2

我可以使用 Vision API 在图像上运行标签检测。但是,我想知道检测到该标签的坐标。例如,如果在图像的某处检测到一个圆圈,我如何在 Vision API 中返回该圆圈的中心?

以下是我在椭圆的局部图像上运行标签检测时返回的内容。返回的内容不包括检测到的对象的 x,y 坐标,例如文本检测具有:

google.cloud.vision.v1.EntityAnnotation.mid : /m/01vkl
google.cloud.vision.v1.EntityAnnotation.description : Circle
google.cloud.vision.v1.EntityAnnotation.score : 0.8125786
google.cloud.vision.v1.EntityAnnotation.topicality : 0.8125786
google.cloud.vision.v1.EntityAnnotation.mid : /m/03scnj
google.cloud.vision.v1.EntityAnnotation.description : Line
google.cloud.vision.v1.EntityAnnotation.score : 0.7547606
google.cloud.vision.v1.EntityAnnotation.topicality : 0.7547606
google.cloud.vision.v1.EntityAnnotation.mid : /m/03g09t
google.cloud.vision.v1.EntityAnnotation.description : Clip art
google.cloud.vision.v1.EntityAnnotation.score : 0.68722004
google.cloud.vision.v1.EntityAnnotation.topicality : 0.68722004
google.cloud.vision.v1.EntityAnnotation.mid : /m/06g58b
google.cloud.vision.v1.EntityAnnotation.description : Oval
google.cloud.vision.v1.EntityAnnotation.score : 0.60591185
google.cloud.vision.v1.EntityAnnotation.topicality : 0.60591185
4

1 回答 1

0

给出某个标签的坐标不是考虑的选项,因为如此所述,标签可以识别一般对象、位置、活动等。
这意味着标签没有专门设置到某个位置,它们是从图像的整个上下文。

但是,有一些标签对应于某些对象(例如,使用此图像,您会看到有标签 'cat' 和对象 'cat',您可以使用 API Explorer 对其进行测试)。因此,您可以在同一图像上运行对象和标签检测,并合并结果以寻找与对象对应的标签。

于 2020-01-16T08:29:52.503 回答