问题标签 [visionkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
117 浏览

ios - 如何在 iOS 中使用 Vision Framework 从图像中提取表格数据?

使用 iOS Vision Framework,我能够执行 OCR 并使用从图像中获取识别的文本

VNRecognizedTextObservation

现在假设,我有一个图像,其中有一些文本段落和一个表格。该表有许多列和相关的行(参见下图)。是否可以使用 Vision 从表中识别特定列的键和值?

例如,我想使用 Vision 从下图中单独获取2014 年零售销售数据。这个怎么做?我们可以同时使用VisionCoreML来做到这一点吗?

在此处输入图像描述

0 投票
0 回答
49 浏览

swift - SwiftUI - 点击按钮执行视觉功能

所以我正在尝试在应用程序中使用 Vision + CoreML,是的,可以肯定的是,它使用 Apple 的 Resnet50 模型可以按预期工作。但是,我希望仅在用户点击按钮时使用 Vision。我相信这是可以检测对象是什么的功能:

所以你可能认为只是在你的视图中调用那个函数,然而,这个函数是在.onAppear()方法上调用的:

如果我取出 setupVision() 函数,我的应用程序将在这一行崩溃:

我可以做些什么来实现快照和扫描功能?我是否应该允许用户拍照(不向他们展示)并处理其余部分,就像使用 CoreML 和 ImagePicker 时一样?

任何帮助都会很棒!

0 投票
0 回答
36 浏览

ios - Visionkit 文档文本识别失败

我正在使用 VisionKit 构建一个带有 OCR 的文档扫描应用程序。但是,当我使用我的任何文档扫描作为输入时,文本只是乱码。我尝试将输入图像转换为 jpeg 和 png,但仍然产生相同的结果。在调试时,我尝试截取我的一个扫描的屏幕截图,然后使用该图像作为输入图像。OCR 完美地解决了令我困惑的问题。对此问题的任何见解将不胜感激。

0 投票
2 回答
390 浏览

ios - VNRecognizeTextRequest iOS 15 识别文本问题

我在使用 iOS 15 的应用程序中发现 Vision 框架存在问题。我在字符串中写入已识别的文本,但在 iOS 15 下,结果的顺序不正确。

也许一个例子会更好地解释它:-)

要扫描的文本:

你好,我的名字是迈克尔,我是一个
名为 Scan2Clipboard 的应用程序的程序员。
现在我已经关注了
VNRecognizeTextRequest 和 iOS 15 的问题。

iOS 14 下的结果:

你好,我的名字是迈克尔,我是一个
名为 Scan2Clipboard 的应用程序的程序员。
现在我已经关注了
VNRecognizeTextRequest 和 iOS 15 的问题。

iOS 15 下的结果:

你好,我的名字是迈克尔,我是一个应用程序的程序员
现在我已经关注了一个
名为 Scan2Clipboard 的问题。
VNRecognizeTextRequest 和 iOS 15。

我尝试了 App Store 中的其他一些应用程序(扫描和复制、快速扫描)。他们表现出相同的行为。他们也在使用 Vision 框架。其他人也有这个问题吗?

下面的第一张图是源,第二张图是结果。请注意结果中间的“Für den Mürbteig”跳跃:

例子:

在此处输入图像描述

0 投票
0 回答
34 浏览

ios - 通过 Vision Framework 检测文本的特定位置

可以在图像上指定检测文本的位置吗?我在网上到处搜索,但没有得到答案。我知道可以检测矩形、人脸、文本和条形码,但我的想法是去图片中的某些(例如 x = 50,y = 50)坐标并检测那里的文本。

0 投票
0 回答
100 浏览

swift - VNRecognizeTextRequest 在 iOS 15 中停止识别文本

我正在使用VNRecognizeTextRequest以下VNImageRequestHandler设置:

我正在使用从 实时捕获AVFoundation,然后转换CMSampleBufferCVPixelBuffer并将其发送到VNImageRequestHandler.

基本上代码取自 Apple 示例: https ://developer.apple.com/documentation/vision/reading_phone_numbers_in_real_time

问题是在 iOS 15 到来之前它运行良好。然后它停止识别文本并出现以下错误:

recognitionLevel一般来说,我可以通过从 更改为.accurate来部分修复它.fast。但我更喜欢第一个,因为它可以提供更好的结果,并且有时.fast只能识别单词中的单个字符,例如,如果有一个带有空格的数字,"7 2 5 6"它只能识别 7 或 2 等等。

提前感谢您的建议。

0 投票
0 回答
31 浏览

swift - 来自 VNDetectRectangleRequest 的边界框被绘制在 ImageView 上的错误位置

ImageView 设置为“缩放填充”。当试图在没有转换的情况下在图像上绘制边界框时,框会出现在它应该在上方的像素,尽管在 x 轴上正确对齐。示例图片:https ://imgur.com/a/Ef4UPbd

当尝试以下我在几个线程上看到的转换解决方案时,Rect 完全消失了。

0 投票
1 回答
172 浏览

ios - Swift 的 Vision 框架无法识别日文字符

我想使用 swift 的 Vision 框架从扫描的图像中读取日文字符。但是,当我尝试将识别语言设置VNRecognizeTextRequest为日语时

request.recognitionLanguages = ["ja", "en"]

我的程序的输出变成了无意义的罗马字母。对于日语文本的每个图像,都会有意外的识别文本输出。但是,当设置为其他语言(例如中文或德语)时,文本输出与预期相同。什么可能导致日本人似乎特有的意外输出?

我正在从这里的 github 项目构建。

0 投票
0 回答
71 浏览

ios - iOS15:Vision Framework VNCoreMLTransform 请求错误

执行 VNCoreMLModel 请求后,从 iOS 15 开始出现以下错误

iOS15之前我们使用的是

现在他们提供了类似的选项

VNRectangleObservation使用查找时遇到此问题observations

未找到 VNDetectorOption_OriginatingRequestSpecifier 所需选项

这种情况所需的 VNOption 是什么?有什么帮助吗?

0 投票
0 回答
34 浏览

ios - iOS15 VisionKit:VNRectangleObservation 返回 Nil 值

这是我使用 AVVisionRectangleRequest 查找矩形的代码

在 Catch Block 中,我遇到了错误。

未找到 VNDetectorOption_OriginatingRequestSpecifier 所需选项” UserInfo={NSLocalizedDescription=VNDetectorOption_OriginatingRequestSpecifier