问题标签 [vision-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
59 浏览

image - 如何将我的类别与使用 Google vision api 在图像中检测到的标签进行匹配?

我使用视觉 api 标记图片。如何使用这些标签对图像进行分类?

0 投票
1 回答
592 浏览

java - google cloud vision api OCR 边界框

我使用了谷歌云视觉 api。

我只想识别图像的某些部分

并通过坐标输入进行ocr分析..(如果我在图像中找到坐标)

不在谷歌示例中。

可能吗?

0 投票
1 回答
216 浏览

swift - MacOS:减少 VNFaceObservation 的 CPU 使用率

我正在尝试使用 Vision API 检测网络摄像头提要中的人脸。CPU 使用率非常高,例如 60% 或 80%。有什么办法可以减少吗?

我尝试过降低从网络摄像头馈送传递的每秒帧数。然而这并没有帮助。这是我尝试检测人脸的方法。这必须实时更新。

0 投票
2 回答
410 浏览

react-native - Google Cloud Vision API 获取提取文本的密钥

我正在使用 Google Cloud Vision API 使用 React-Native 扫描名片,并且 OCR 部分运行良好。这是我目前的存档。

原始图像 安卓应用

正如您在第二张图片中看到的那样,该应用程序也在识别文本,我想将其映射到键。表示我想将“JOHN”映射到“First Name”,将“SMITH”映射到“Last Name”,+0 123 456 789 324 映射到“Phone Number”。

这是我当前的有效载荷。你认为我应该用什么来标记文本?请尽快教我。

0 投票
1 回答
62 浏览

google-cloud-platform - Google Vision API 'TypeError:无效文件'

以下代码来自 Google 的 Vision API 文档,我所做的唯一修改是在底部添加函数的参数解析器。

如果我从下面这样的终端运行它,我会收到这个无效文件错误:

我尝试过使用各种图像和图像类型以及从不同位置运行代码但没有成功。

0 投票
1 回答
275 浏览

java - 如何在 Java 中的 Google Vision API 的标签检测中返回标签的像素坐标(或位置)?

我可以使用 Vision API 在图像上运行标签检测。但是,我想知道检测到该标签的坐标。例如,如果在图像的某处检测到一个圆圈,我如何在 Vision API 中返回该圆圈的中心?

以下是我在椭圆的局部图像上运行标签检测时返回的内容。返回的内容不包括检测到的对象的 x,y 坐标,例如文本检测具有:

0 投票
0 回答
90 浏览

ios - 视觉文本识别器给出零结果

我希望你做得很好,我遇到了一个奇怪的问题。我已经实现了视觉文本识别器,并在成功提取图像并将该图像分配给 visionImage 但我得到错误 = nil 并且结果 = nil。结果块中没有 nil 我遵循了谷歌文档链接https://firebase.google.com/docs/ml-kit/ios/recognize-text。但结果为零。

请帮助我或说明为什么结果块中出现该 nil 的原因。这样我就可以修复它。

提前非常感谢您,等待您的回复。

问候, 阿泽姆·乌斯马尼

0 投票
0 回答
122 浏览

python - 用于基于 django 的网站的 Google Vision API

我开发了一个使用 Django 上传和下载图像的网站。我还使用 Google Vision API 编写了一个 python 代码,并在命令行上成功执行了该文件。现在,我应该将 python 代码放在我的 Django 项目中的什么位置,以便我的图像通过 API?

0 投票
1 回答
54 浏览

api - 用于从 PDF 中提取或解析数据的云视觉 API

我如何使用 Google Cloud vision API 从 PDF(我的输入)中提取或解析数据,我需要将 PDF 内容保存到数据库并将一些数据写入我的 HTML 页面,我们该怎么做?

0 投票
1 回答
199 浏览

ocr - 如何从python中的手写图像中提取日期

仅从手写文本图像中提取“日期”,而不限制 python 中数据的坐标。日期格式可以是任何形式,例如:

等等

如本链接所述:https ://www.researchgate.net/publication/261342693_Date_Field_Extraction_in_Handwritten_Documents