问题标签 [vision-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
100 浏览

ios - 如何在使用移动视觉人脸检测器时点击 UIView 进行捕捉

我正在尝试在点击 UIView 时捕获静止图像。

项目来自: https ://github.com/googlesamples/ios-vision

FaceDetectorDemo → FaceDetector → CameraViewController.m

我将人脸检测器项目从 Objective-C 转换为 Swift,但我需要添加一个额外的功能,用户点击屏幕进行捕捉,但无法弄清楚。

我的代码:

saveToCamera点击UIView.

0 投票
1 回答
166 浏览

android - MediaStore.Images.Media.getBitmap 需要太多时间

我想检查外部存储中的照片中是否至少有一张人脸。

我像这样查询外部内容:

获取 uri 需要 0.004 秒

getBitmap() 花费太多时间。大约需要10s。

getBitmap() 占用了总时间的 90%,所以这里是一个瓶颈。我能做些什么来让它更快吗?

0 投票
1 回答
465 浏览

google-cloud-ml - 云视觉 API 对 OCR 的 JSON 响应的付费版本中缺少“信心”字段

来自免费版 Vision API ( https://cloud.google.com/vision/docs/drag-and-drop ) 的 JSON 响应具有名为“Confidence”的字段,它显示了模型在单词级别上的识别置信度和人物等级。在付费版本中,此字段缺失。JSON 示例如下。

拖放输出 JSON 结构:

付费版输出结构:

此功能是否处于测试阶段,任何付费用户都无法使用?我想使用人物级别模型的信心,我该如何使用?

0 投票
2 回答
533 浏览

google-cloud-platform - Google Cloud Vision Api 仅返回“名称”

我正在尝试使用 Google Cloud Vision API。

我在此链接中使用 REST API 。

发布https://vision.googleapis.com/v1/files:asyncBatchAnnotate

我的要求是

但响应始终只有“名称”,如下所示:

我的“gs”位置是有效的。当我在“gcsSource”中写错路径时,就会出现 404 not found 错误。谁知道为什么我的反应很奇怪?

0 投票
1 回答
90 浏览

android - Vision API 裁剪人脸地标

我正在尝试用路径勾勒出整个图像的轮廓,以便将其裁剪掉,但路径并未遵循面部轮廓。这是我的代码:

在此处输入图像描述

如何使路径仅遵循脸部的外部轮廓

0 投票
2 回答
2860 浏览

java - Groovy Spock 模拟调用模拟类的真实方法

我正在尝试为使用 Google 视觉 API 和 lib 的类编写单元AnnotatorImageClient测试google-cloud-vision。问题是我的嘲笑AnnotatorImageClient由于某种原因仍然调用了真正的batchAnnotateImages方法,然后抛出了一个 NPE,这打破了我的测试。我以前从未在模拟中看到过这种行为,我想知道我是否做错了什么,spock/groovy 中是否存在错误,或者它是否与该 Google 库有关?

我已经检查过我班级中使用的对象是否真的是一个模拟对象,它就是。我尝试过使用 Spock 版本 1.2-groovy-2.5 和 1.3-groovy.2.5

被测试的类:

考试:

我希望模拟能够简单地返回null(我知道这个测试没有多大意义)。相反,它调用com.google.cloud.vision.v1.ImageAnnotatorClient.batchAnnotateImageswhich 抛出 NPE。

0 投票
0 回答
463 浏览

android - 如何使用 Google Vision 裁剪检测到的数字 (OCR) 区域?

我写了一个代码来了解金钱的价值。我正在使用 Mobile Vision 的 OCR 来获取数字和单词,然后如果匹配(我设置了一些条件),应用程序将播放该值的声音。现在我想做一些实验。我希望这个应用程序裁剪数字周围的区域并将其显示在我的活动中。这就是我所做的。

只是如何像下面这张图片一样裁剪数字(红色框),然后我将使用 ImageView 在我的活动中显示它。 红色的 谢谢

0 投票
1 回答
381 浏览

javascript - 无法读取从烧瓶发送到 javascript 的对象 BoundingPoly。想在 html 中使用这个边界并在图像上绘制这个边界

这些边界从 doctext.py DocText.py 返回:

app.py 使用烧瓶:

边界多边形值

当我将边界传递给 html 时,我想在 js 中访问这个 boundingpoly 列表以使用 html 中的 canvas js 绘制矩形

它不工作。

我想将它作为 js 中的对象读取并访问这些对象顶点并在画布上绘制。

当渲染模板变量边界时,它作为列表传递并且无法在 javascript 中读取,甚至尝试过 json 转储,它显示 Object BoundingPoly is not Json serializable。我该怎么做?

0 投票
1 回答
157 浏览

python - 谷歌视觉 API 不打印退货

我正在使用 python 中的一些脚本并试图找出这些图像是否返回结果。但是,当运行 python 时不会打印任何内容。我没有收到错误,但似乎无法弄清楚。

我的工作基于这些例子

https://cloud.google.com/vision/docs/quickstart-client-libraries#client-libraries-install-python

https://cloud.google.com/vision/docs/internet-detection

0 投票
1 回答
118 浏览

google-cloud-platform - 将其他语言输出到 Cloud Pub/Sub 主题

我将 Google Cloud Functions 与他们的 Vision API 和 Translate API 结合使用来从图像中提取文本,然后将提取的文本翻译成各种语言。输出将传递到 Pub/Sub 主题,然后存储在 Cloud Storage 存储分区中。所有组件似乎都工作正常,除了我的输出没有为语言正确编码,所以我得到的字符串是“Pâté Oeufs Mimosa”而不是“Pâté – Oeufs Mimosa”。

这是我正在使用的相关代码: