问题标签 [vision-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
41 浏览

google-cloud-platform - 是否有规定提取给定图片的标题

我正在尝试使用 Vision API 来提取图像的标题

看起来 Vision API 没有提供关于图像的标题。它提供图像中的对象列表。

看起来IBM Caption Generator为图像提供了 Caption。

0 投票
1 回答
130 浏览

google-cloud-platform - vision api产品搜索的产品集数据UI

谷歌云控制台中是否有任何 UI 可用于浏览为视觉 api 产品搜索创建的产品集?我可以编写 python 脚本来获取该数据,但只是想知道是否有任何我错过的 UI 可用。

0 投票
2 回答
3356 浏览

java - 将 Java 与 Google 的 Vision API 结合使用时,如何解决“错误:指定的 GCS 路径无效”?

我目前在 Vision API 文档上关注此示例:在此处找到

将 gcsPath 字符串传入示例中的 detectTextGcs 方法后,出现错误:“错误:指定的 GCS 路径无效:https ://www.w3.org/TR/SVGTiny12/examples/textArea01.png ”

我期待 PrintStream 对象将图片中保存的文本写入文件,即“明天,\n明天,和\n明天;等等等等……”。在上面提到的 Vision API 文档页面上尝试 API 后,它工作正常,但在 IntelliJ 中不行。

任何帮助是极大的赞赏。谢谢你。(如果这不是一个措辞好的问题,请原谅我,这是我第一次发帖)

0 投票
1 回答
356 浏览

google-cloud-platform - 是否有使用云视觉 api 提取图像字体属性的功能

文本提取用于从图像中提取文本。我们可以使用文本提取功能从给定图像中 提取图像字体属性,例如字体系列、字体样式、字体大小等吗? 在此处输入图像描述

预计提取以下特征

字体系列: TimeNewRoman

字号: 18

字体颜色:黑色

0 投票
0 回答
134 浏览

node.js - 未捕获的类型错误:gax.GoogleProtoFilesRoot 不是构造函数

我正在尝试使用google vision api来识别图像
main.js中的文本

但是当我查看我在控制台中得到的内容时,这就是我得到的:

未捕获的类型错误:gax.GoogleProtoFilesRoot 不是构造函数

0 投票
1 回答
108 浏览

google-cloud-platform - 在 GCP 人脸检测中,我们应该假设哪个轴是测量侧倾角的轴?

我需要旋转面部图像。我想了解 GCP 人脸检测的输出。对于滚动角,轴应该在哪里?在口腔中心?在鼻子上?在图像文件的左下角?

滚动角的定义在这里:http ://www.conitec.net/beta/aentity-pan.htm 输出的 GCP 解释似乎在这个过时的页面中:https ://developers.google.com/vision/ face-detection-concepts 这里z轴似乎位于左下角,如果我们想要精确的话,这是不可能的。要获得具有该旋转的图像,我们需要将轴定位在头部。


更新:有人告诉我旋转是相对于图像的中心的。谁能证实这一点?

0 投票
2 回答
1479 浏览

node.js - Google Vision API Text Detection with Node.js set Language hint

I'm using @google-cloud/vision with Node.js

I use the sample code as below

This is currently working working and return english texts and numbers. I have texts in image which Vision API's Experimental languages. How can I set the language hint as document specified in node.js API?

https://cloud.google.com/vision/docs/ocr

0 投票
1 回答
108 浏览

opencv - 如何“迭代”计算机视觉机器学习模型?

我使用谷歌云视觉 api 创建了一个模型。我花了无数个小时标记数据,并训练了一个模型。在将近 20 个小时的“训练”模型结束时,它仍然是碰碰运气。

我如何迭代这个模型?我不想失去到目前为止所做的“学习”。它的工作效率约为 3/5 次。

我最好的猜测是我应该再次遍历对象,找到错误的地方,并相应地标记。但我不确定最好的方法。我应该将所有“遗漏”的图像标记为测试数据图像吗?我可以阅读有关此主题的最佳实践或资源吗?

0 投票
1 回答
255 浏览

azure - 用于矢量 PDF 的 Azure 读取 API

我正在使用 Azure Read API 开发 OCR 解决方案,它为光栅 PDF 提供了开箱即用的解决方案

https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/concept-recognizing-text#read-api

但我不知道它是否可以支持基于矢量的 PDF。通过使用 Aspose 和 PDFxStream 等第三方库,我有其他解决方案,但如果我可以只停留在 Azure Vision API 生态系统中,我更喜欢。

所以我的问题是是否可以将 Read API 用于矢量 PDF,如果不是,我可以使用的最佳实用方法是什么?

0 投票
1 回答
130 浏览

ocr - 读取 API 多页 PDF 处理

我已经在这里这里阅读了完整的文档,并创建了十几个示例,但是如果 Read API 并行或连续处理多页 PDF,我仍然无法获得?如果有人对此 Azure 服务有深入的了解,请提出建议并分享您对此主题的经验。