java - 如何在 Java 中的 Google Vision API 的标签检测中返回标签的像素坐标（或位置）？

Question

我可以使用 Vision API 在图像上运行标签检测。但是，我想知道检测到该标签的坐标。例如，如果在图像的某处检测到一个圆圈，我如何在 Vision API 中返回该圆圈的中心？

以下是我在椭圆的局部图像上运行标签检测时返回的内容。返回的内容不包括检测到的对象的 x,y 坐标，例如文本检测具有：

google.cloud.vision.v1.EntityAnnotation.mid : /m/01vkl
google.cloud.vision.v1.EntityAnnotation.description : Circle
google.cloud.vision.v1.EntityAnnotation.score : 0.8125786
google.cloud.vision.v1.EntityAnnotation.topicality : 0.8125786
google.cloud.vision.v1.EntityAnnotation.mid : /m/03scnj
google.cloud.vision.v1.EntityAnnotation.description : Line
google.cloud.vision.v1.EntityAnnotation.score : 0.7547606
google.cloud.vision.v1.EntityAnnotation.topicality : 0.7547606
google.cloud.vision.v1.EntityAnnotation.mid : /m/03g09t
google.cloud.vision.v1.EntityAnnotation.description : Clip art
google.cloud.vision.v1.EntityAnnotation.score : 0.68722004
google.cloud.vision.v1.EntityAnnotation.topicality : 0.68722004
google.cloud.vision.v1.EntityAnnotation.mid : /m/06g58b
google.cloud.vision.v1.EntityAnnotation.description : Oval
google.cloud.vision.v1.EntityAnnotation.score : 0.60591185
google.cloud.vision.v1.EntityAnnotation.topicality : 0.60591185

score 0 · Accepted Answer

给出某个标签的坐标不是考虑的选项，因为如此处所述，标签可以识别一般对象、位置、活动等。
这意味着标签没有专门设置到某个位置，它们是从图像的整个上下文。

但是，有一些标签对应于某些对象（例如，使用此图像，您会看到有标签 'cat' 和对象 'cat'，您可以使用 API Explorer 对其进行测试）。因此，您可以在同一图像上运行对象和标签检测，并合并结果以寻找与对象对应的标签。

java - 如何在 Java 中的 Google Vision API 的标签检测中返回标签的像素坐标（或位置）？

1 回答 1

Related

Reference