问题标签 [vision-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 是否有规定提取给定图片的标题
我正在尝试使用 Vision API 来提取图像的标题
看起来 Vision API 没有提供关于图像的标题。它提供图像中的对象列表。
看起来IBM Caption Generator为图像提供了 Caption。
google-cloud-platform - vision api产品搜索的产品集数据UI
谷歌云控制台中是否有任何 UI 可用于浏览为视觉 api 产品搜索创建的产品集?我可以编写 python 脚本来获取该数据,但只是想知道是否有任何我错过的 UI 可用。
java - 将 Java 与 Google 的 Vision API 结合使用时,如何解决“错误:指定的 GCS 路径无效”?
我目前在 Vision API 文档上关注此示例:在此处找到
将 gcsPath 字符串传入示例中的 detectTextGcs 方法后,出现错误:“错误:指定的 GCS 路径无效:https ://www.w3.org/TR/SVGTiny12/examples/textArea01.png ”
我期待 PrintStream 对象将图片中保存的文本写入文件,即“明天,\n明天,和\n明天;等等等等……”。在上面提到的 Vision API 文档页面上尝试 API 后,它工作正常,但在 IntelliJ 中不行。
任何帮助是极大的赞赏。谢谢你。(如果这不是一个措辞好的问题,请原谅我,这是我第一次发帖)
node.js - 未捕获的类型错误:gax.GoogleProtoFilesRoot 不是构造函数
我正在尝试使用google vision api来识别图像
main.js中的文本
但是当我查看我在控制台中得到的内容时,这就是我得到的:
未捕获的类型错误:gax.GoogleProtoFilesRoot 不是构造函数
google-cloud-platform - 在 GCP 人脸检测中,我们应该假设哪个轴是测量侧倾角的轴?
我需要旋转面部图像。我想了解 GCP 人脸检测的输出。对于滚动角,轴应该在哪里?在口腔中心?在鼻子上?在图像文件的左下角?
滚动角的定义在这里:http ://www.conitec.net/beta/aentity-pan.htm 输出的 GCP 解释似乎在这个过时的页面中:https ://developers.google.com/vision/ face-detection-concepts 这里z轴似乎位于左下角,如果我们想要精确的话,这是不可能的。要获得具有该旋转的图像,我们需要将轴定位在头部。
更新:有人告诉我旋转是相对于图像的中心的。谁能证实这一点?
node.js - Google Vision API Text Detection with Node.js set Language hint
I'm using @google-cloud/vision
with Node.js
I use the sample code as below
This is currently working working and return english texts and numbers. I have texts in image which Vision API's Experimental languages. How can I set the language hint as document specified in node.js API?
opencv - 如何“迭代”计算机视觉机器学习模型?
我使用谷歌云视觉 api 创建了一个模型。我花了无数个小时标记数据,并训练了一个模型。在将近 20 个小时的“训练”模型结束时,它仍然是碰碰运气。
我如何迭代这个模型?我不想失去到目前为止所做的“学习”。它的工作效率约为 3/5 次。
我最好的猜测是我应该再次遍历对象,找到错误的地方,并相应地标记。但我不确定最好的方法。我应该将所有“遗漏”的图像标记为测试数据图像吗?我可以阅读有关此主题的最佳实践或资源吗?
azure - 用于矢量 PDF 的 Azure 读取 API
我正在使用 Azure Read API 开发 OCR 解决方案,它为光栅 PDF 提供了开箱即用的解决方案
但我不知道它是否可以支持基于矢量的 PDF。通过使用 Aspose 和 PDFxStream 等第三方库,我有其他解决方案,但如果我可以只停留在 Azure Vision API 生态系统中,我更喜欢。
所以我的问题是是否可以将 Read API 用于矢量 PDF,如果不是,我可以使用的最佳实用方法是什么?