问题标签 [apple-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - 从 VNFaceObservation 对人脸进行分类
我正在使用Vision
框架来检测多个图像上的人脸和对象,并且效果非常好。
但是我有一个在文档中找不到的问题。iOS 上的照片应用程序对人脸进行分类,您可以单击人脸并显示该人脸的所有图像。
如何对照片应用程序等人脸进行分类?是否有任何唯一标识符或类似的标识符来执行此操作?
谢谢!
ios - 有没有人尝试过如何在 ios 11 中使用 vision api(VNHomographicImageRegistrationRequest)?
我正在研究与 iOS11 的 Vision SDK 相关的货币识别问题。我在处理时遇到问题VNHomographicImageRegistrationRequest
,它决定了对齐两个图像的内容所需的透视扭曲矩阵。但是我找不到如何将两个图像参数发送到这个 API,有人可以帮我吗?
ios - 带有摄像头直播和 ARKit 的视觉
我想实现这样的场景:使用相机实时流Vision
来检测一些矩形,然后根据一些逻辑处理这个输出,然后根据逻辑输出显示 AR 元素ARKit
。
我发现的示例并未涵盖从Vision
实时流检测到ARKit
with 的整个过程SpriteKit
,而是分别针对这些“步骤”。我为直播找到的那个Vision
是使用一个UIImageView
。我发现 for ARKit
with的其他人SpriteKit
正在使用ARSKView
for that。
将所有这些集成到逐步过程中的最佳方法Vision
-> 逻辑 ->ARKit
将是?
ios - 使用 ARSKView 和 Vision 检测文本
我有一个视图控制器,ARSKView
其ARSession
配置如下:
在其相关的SKScene
我有这个方法实现:
然后,一些逻辑来绘制包裹检测到的文本的矩形。我在这篇文章中发现了这样的逻辑,其中ARKit
并ARSKView
没有使用,而是使用了AVCaptureSession
and AVCaptureVideoPreviewLayer
。ARKit
当您运行该示例时,与我使用and运行项目时相比,相机质量更好,文本框绘制更准确ARSKView
。
我需要使用ARKit
with SpriteKit
,但是当我将相机靠近文本时,它们会显示为模糊,并且通常包装单词的框被绘制得很错位。
有什么办法可以改善吗?
ios - 在 Vision Framework 中获取 VNTextObservation 矩形的图像部分
我能够获取在 iOS 11 的视觉框架视频源中检测到的文本矩形,但我正在尝试获取被识别为文本或字符的视频的图像部分。有人可以帮忙吗?
那么我怎样才能得到图像的一部分region?.characterBoxes
swift - 用于对象识别的 ARKit 和 Vision 框架
我真的很想获得一些关于将 Apple 的新 Vision API 与 ARKit 结合起来以实现对象识别的指导。这不需要跟踪移动的物体,只需识别它在 3d 空间中的稳定状态,AR 体验就会做出相应的反应。
我知道这种类型的体验可以在Vuforia
或之类的服务中使用Wikitude
,但我想仅使用本机 Apple API 来尝试。
ios - iOS Vision Framework 图像校正
我想使用 iOS 视觉框架的VNHomographicImageRegistrationRequest
. 可能吗?
到目前为止,我已经获得了一个似乎无法纠正图像的 3x3 扭曲矩阵。
应该如何使用扭曲矩阵(我在网上找不到任何示例)?
此外,图像对齐与图像校正有何不同(我理解图像校正,但不是图像对齐)?
Xcode 游乐场:
OpenCV 图像变形:
ios11 - 错误“超过允许的最大跟踪器数量”是什么意思?
我正在按照本教程在 iOS 11 上实现对象跟踪。我能够完美地跟踪对象,直到某个点,然后控制台中出现此错误。
抛出:错误域 = com.apple.vis 代码 = 9“内部错误:超过跟踪器类型的最大允许跟踪器数量:VNObjectTrackerType” UserInfo={NSLocalizedDescription=内部错误:超过跟踪器类型的最大允许跟踪器数量:VNObjectTrackerType }
是我错误地使用了 API,还是 Vision 无法处理太多连续的对象跟踪任务?好奇是否有人能洞察为什么会发生这种情况。
ios - 停止在 Apple Vision、iOS、Swift 中检测字母
我正在使用 Vision 检测文本,它工作正常我让它在检测到某些东西并调用函数时使用完成,但仍在检测到文本。
如何停止文本检测
要开始它,我正在使用: