问题标签 [vision-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
367 浏览

python-3.x - VisionAPI 的 DOCUMENT_TEXT_DETECTION 的 Symbol 没有信心

实现内容:OCR (get word from image) API:VisionAPI(Google) 语言:Python3.x

Q. 所有响应(块/段落/单词/符号)都应该有信心(param)。当然块/段落/单词有信心,但符号很少没有信心。概率是(67个字符/ 48036个字符)=0.14% ......我无法理解这种现象......

CODE(确定上述概率)

为了确定,请检查代码(从 VisionAPI 获取响应,并保存 .json)

0 投票
0 回答
360 浏览

cloud - 为 GOOGLE_APPLICATION_CREDENTIALS 设置环境变量后要做什么

我已经为谷歌凭据设置了环境变量,但我不知道下一步是什么。请帮我解决这个错误

环境变量

0 投票
1 回答
1942 浏览

azure - 从任何零售店收据中提取结构化数据(Azure 计算机视觉 API OCR)

在扫描任何零售商店收据后,我们如何从 Azure 计算机视觉 API OCR 生成的文本中提取结构化数据(商户、购买日期、税收、总计等)。谢谢

0 投票
1 回答
123 浏览

microsoft-cognitive - Azure Cognitiveservices 计算机视觉 Java SDK 的源代码

我在我的项目中使用以下 java SDK 库:

但是我发现了一个错误,我想贡献一个补丁,是否有任何带有源代码的存储库?

0 投票
1 回答
1005 浏览

google-cloud-platform - Vision API 的话题性和分数始终相同

当我查看 Google Vision API 的 label_annotions 时,“score”和“topicality”字段值总是相同的。这也是例如这里的情况。根据这个参考,话题性是指“ICA(图像内容注释)标签与图像的相关性”,而分数已取代“置信度”。虽然现在我不太清楚“分数”的真正含义。

这些应该总是一样的吗?这意味着什么?

0 投票
1 回答
1394 浏览

google-cloud-platform - Google Vision API 文本提取数据准确性 (DOCUMENT_TEXT_DETECTION)

使用 JAVA SDK for GCP Vision API 进行 OCR(文本提取)。已将 Feature TEXT_DETECTION移至DOCUMENT_TEXT_DETECTION。我测试过的图像名为“Mohan D”。

  • TEXT_DETECTION:我得到一个正确的文本,但没有得到另一个字符
  • 如果我使用DOCUMENT_TEXT_DETECTION,得到一个名称为“MOHAND(空间不来)

您能否建议,我是否需要使用任何特定选项来获得更高的数据准确性

0 投票
2 回答
558 浏览

microsoft-cognitive - 使用认知服务在保存的图像中查找相似图像

我可以在认知服务视觉 API 中使用比较图像的 API 吗?有时我们从两个品牌进口产品,这两个品牌都从同一个卖家那里购买了产品,但用自己的产品信息更改了产品 ID。我想保存所有带有一些元数据的图像,然后能够上传图像->将其与存储的图像进行比较,并获得一个带有看起来像我上传的图像的结果集。

0 投票
1 回答
5381 浏览

android - 如何使用 Mobile Vision API 获取图像中文本的位置?

如何使用 Mobile Vision API 获取图像中文本在屏幕上的位置,以及如何在它们周围绘制一个矩形?

例子:

在此处输入图像描述

0 投票
1 回答
1269 浏览

python - AttributeError:模块“google.cloud.vision”没有属性“客户端”

**帮我用这个简单的脚本在 python 中实现 google vision API。

我安装了我需要的所有要求,但仍然看到该错误**

AttributeError:模块“google.cloud.vision”没有属性“客户端”

Traceback(最近一次通话最后一次):文件“C:/Users/TAKWA/Desktop/vision/44.py”,第 4 行,位于 vision_client = vision.Client() AttributeError: module 'google.cloud.vision' has no attribute '客户'


0 投票
0 回答
260 浏览

swift - 我们如何使用 hitTest 处理多个 QR 码检测并在其上添加节点

我正在尝试检测屏幕中的多个 QR 码并使用 ARKit 在其上添加信息。

我使用 Vision API 进行多个 QR 码检测,它工作得很好,但是在一次测试多个 QR 码时,HitTestResults 始终为 nil。如果检测到 SINGLE QR 码,它与 hittest 一起工作正常,我添加节点及其位置,即 hittest.worldtransform 但是当我尝试点击测试多个检测到的 qr 码边界框时,它总是失败/变为 nil 。任何人都可以有同样的问题或帮助我解决这个问题吗?

我使用 Vision API 进行多个 QR 码检测,它工作得很好,但是在一次测试多个 QR 码时,HitTestResults 始终为 nil。如果检测到 SINGLE QR 码,它与 hittest 一起工作正常,我添加节点及其位置,即 hittest.worldtransform 但是当我尝试点击测试多个检测到的 qr 码边界框时,它总是失败/变为 nil 。

我正在尝试查找如何使用 hitTest 处理多个 QR 码检测并在其上添加节点