问题标签 [apple-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1170 浏览

ios - 从 VNFaceObservation 对人脸进行分类

我正在使用Vision框架来检测多个图像上的人脸和对象,并且效果非常好。

但是我有一个在文档中找不到的问题。iOS 上的照片应用程序对人脸进行分类,您可以单击人脸并显示该人脸的所有图像。

如何对照片应用程序等人脸进行分类?是否有任何唯一标识符或类似的标识符来执行此操作?

谢谢!

0 投票
2 回答
1133 浏览

ios - 有没有人尝试过如何在 ios 11 中使用 vision api(VNHomographicImageRegistrationRequest)?

我正在研究与 iOS11 的 Vision SDK 相关的货币识别问题。我在处理时遇到问题VNHomographicImageRegistrationRequest,它决定了对齐两个图像的内容所需的透视扭曲矩阵。但是我找不到如何将两个图像参数发送到这个 API,有人可以帮我吗?

0 投票
0 回答
381 浏览

ios - 带有摄像头直播和 ARKit 的视觉

我想实现这样的场景:使用相机实时流Vision来检测一些矩形,然后根据一些逻辑处理这个输出,然后根据逻辑输出显示 AR 元素ARKit

我发现的示例并未涵盖从Vision实时流检测到ARKitwith 的整个过程SpriteKit,而是分别针对这些“步骤”。我为直播找到的那个Vision是使用一个UIImageView。我发现 for ARKitwith的其他人SpriteKit正在使用ARSKViewfor that。

将所有这些集成到逐步过程中的最佳方法Vision-> 逻辑 ->ARKit将是?

0 投票
0 回答
419 浏览

ios - 使用 ARSKView 和 Vision 检测文本

我有一个视图控制器,ARSKViewARSession配置如下:

在其相关的SKScene我有这个方法实现:

然后,一些逻辑来绘制包裹检测到的文本的矩形。我在这篇文章中发现了这样的逻辑,其中ARKitARSKView没有使用,而是使用了AVCaptureSessionand AVCaptureVideoPreviewLayerARKit当您运行该示例时,与我使用and运行项目时相比,相机质量更好,文本框绘制更准确ARSKView

我需要使用ARKitwith SpriteKit,但是当我将相机靠近文本时,它们会显示为模糊,并且通常包装单词的框被绘制得很错位。

有什么办法可以改善吗?

0 投票
0 回答
480 浏览

ios - 在 Vision Framework 中获取 VNTextObservation 矩形的图像部分

我能够获取在 iOS 11 的视觉框架视频源中检测到的文本矩形,但我正在尝试获取被识别为文本或字符的视频的图像部分。有人可以帮忙吗?

那么我怎样才能得到图像的一部分region?.characterBoxes

0 投票
3 回答
2114 浏览

swift - 用于对象识别的 ARKit 和 Vision 框架

我真的很想获得一些关于将 Apple 的新 Vision API 与 ARKit 结合起来以实现对象识别的指导。这不需要跟踪移动的物体,只需识别它在 3d 空间中的稳定状态,AR 体验就会做出相应的反应。

我知道这种类型的体验可以在Vuforia或之类的服务中使用Wikitude,但我想仅使用本机 Apple API 来尝试。

0 投票
0 回答
1053 浏览

ios - iOS Vision Framework 图像校正

我想使用 iOS 视觉框架的VNHomographicImageRegistrationRequest. 可能吗?

到目前为止,我已经获得了一个似乎无法纠正图像的 3x3 扭曲矩阵。

应该如何使用扭曲矩阵(我在网上找不到任何示例)?

此外,图像对齐与图像校正有何不同(我理解图像校正,但不是图像对齐)?

Xcode 游乐场:

OpenCV 图像变形:

0 投票
3 回答
1739 浏览

ios11 - 错误“超过允许的最大跟踪器数量”是什么意思?

我正在按照本教程在 iOS 11 上实现对象跟踪。我能够完美地跟踪对象,直到某个点,然后控制台中出现此错误。

抛出:错误域 = com.apple.vis 代码 = 9“内部错误:超过跟踪器类型的最大允许跟踪器数量:VNObjectTrackerType” UserInfo={NSLocalizedDescription=内部错误:超过跟踪器类型的最大允许跟踪器数量:VNObjectTrackerType }

是我错误地使用了 API,还是 Vision 无法处理太多连续的对象跟踪任务?好奇是否有人能洞察为什么会发生这种情况。

0 投票
1 回答
2751 浏览

ios - 检测带有矩形的文本而不是整个屏幕的视觉,iOS,Swift

我使用 Vision 进行文本检测,但这会在所有屏幕上显示检测,有没有办法让它只检测特定区域,例如我在屏幕中间绘制的矩形。

因此,当整个屏幕是一个相机但如果文本在中心输入一个矩形时,它会在其周围绘制框。

我想要的照片

下面是我的文本检测代码和cameraPreviewLayer.

如果可能的话,我需要 2 个相机预览层吗?

0 投票
1 回答
847 浏览

ios - 停止在 Apple Vision、iOS、Swift 中检测字母

我正在使用 Vision 检测文本,它工作正常我让它在检测到某些东西并调用函数时使用完成,但仍在检测到文本。

如何停止文本检测

要开始它,我正在使用: