问题标签 [visionkit]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

33 问题

0 投票

0 回答

117 浏览

ios - 如何在 iOS 中使用 Vision Framework 从图像中提取表格数据？

使用 iOS Vision Framework，我能够执行 OCR 并使用从图像中获取识别的文本

VNRecognizedTextObservation

现在假设，我有一个图像，其中有一些文本段落和一个表格。该表有许多列和相关的行（参见下图）。是否可以使用 Vision 从表中识别特定列的键和值？

例如，我想使用 Vision 从下图中单独获取2014 年零售销售数据。这个怎么做？我们可以同时使用Vision和CoreML来做到这一点吗？

ios opencv computer-vision coreml visionkit

2021-05-13T08:15:07.210

0 投票

0 回答

49 浏览

swift - SwiftUI - 点击按钮执行视觉功能

所以我正在尝试在应用程序中使用 Vision + CoreML，是的，可以肯定的是，它使用 Apple 的 Resnet50 模型可以按预期工作。但是，我希望仅在用户点击按钮时使用 Vision。我相信这是可以检测对象是什么的功能：

所以你可能认为只是在你的视图中调用那个函数，然而，这个函数是在.onAppear()方法上调用的：

如果我取出 setupVision() 函数，我的应用程序将在这一行崩溃：

我可以做些什么来实现快照和扫描功能？我是否应该允许用户拍照（不向他们展示）并处理其余部分，就像使用 CoreML 和 ImagePicker 时一样？

任何帮助都会很棒！

swift swiftui coreml visionkit

2021-07-25T15:09:14.920

0 投票

0 回答

36 浏览

ios - Visionkit 文档文本识别失败

我正在使用 VisionKit 构建一个带有 OCR 的文档扫描应用程序。但是，当我使用我的任何文档扫描作为输入时，文本只是乱码。我尝试将输入图像转换为 jpeg 和 png，但仍然产生相同的结果。在调试时，我尝试截取我的一个扫描的屏幕截图，然后使用该图像作为输入图像。OCR 完美地解决了令我困惑的问题。对此问题的任何见解将不胜感激。

ios swift visionkit

2021-08-23T16:36:04.407

0 投票

2 回答

390 浏览

ios - VNRecognizeTextRequest iOS 15 识别文本问题

我在使用 iOS 15 的应用程序中发现 Vision 框架存在问题。我在字符串中写入已识别的文本，但在 iOS 15 下，结果的顺序不正确。

也许一个例子会更好地解释它:-)

要扫描的文本：

你好，我的名字是迈克尔，我是一个
名为 Scan2Clipboard 的应用程序的程序员。
现在我已经关注了
VNRecognizeTextRequest 和 iOS 15 的问题。

iOS 14 下的结果：

你好，我的名字是迈克尔，我是一个
名为 Scan2Clipboard 的应用程序的程序员。
现在我已经关注了
VNRecognizeTextRequest 和 iOS 15 的问题。

iOS 15 下的结果：

你好，我的名字是迈克尔，我是一个应用程序的程序员
现在我已经关注了一个
名为 Scan2Clipboard 的问题。
VNRecognizeTextRequest 和 iOS 15。

我尝试了 App Store 中的其他一些应用程序（扫描和复制、快速扫描）。他们表现出相同的行为。他们也在使用 Vision 框架。其他人也有这个问题吗？

下面的第一张图是源，第二张图是结果。请注意结果中间的“Für den Mürbteig”跳跃：

ios swift visionkit

2021-09-26T17:56:02.150

0 投票

0 回答

34 浏览

ios - 通过 Vision Framework 检测文本的特定位置

可以在图像上指定检测文本的位置吗？我在网上到处搜索，但没有得到答案。我知道可以检测矩形、人脸、文本和条形码，但我的想法是去图片中的某些（例如 x = 50，y = 50）坐标并检测那里的文本。

ios swift vision visionkit

2021-10-05T08:42:06.883

0 投票

0 回答

100 浏览

swift - VNRecognizeTextRequest 在 iOS 15 中停止识别文本

我正在使用VNRecognizeTextRequest以下VNImageRequestHandler设置：

我正在使用从实时捕获AVFoundation，然后转换CMSampleBuffer为CVPixelBuffer并将其发送到VNImageRequestHandler.

基本上代码取自 Apple 示例： https ://developer.apple.com/documentation/vision/reading_phone_numbers_in_real_time

问题是在 iOS 15 到来之前它运行良好。然后它停止识别文本并出现以下错误：

recognitionLevel一般来说，我可以通过从更改为.accurate来部分修复它.fast。但我更喜欢第一个，因为它可以提供更好的结果，并且有时.fast只能识别单词中的单个字符，例如，如果有一个带有空格的数字，"7 2 5 6"它只能识别 7 或 2 等等。

提前感谢您的建议。

swift iphone ios15 visionkit ios-vision

2021-10-06T22:02:12.497

0 投票

0 回答

31 浏览

swift - 来自 VNDetectRectangleRequest 的边界框被绘制在 ImageView 上的错误位置

ImageView 设置为“缩放填充”。当试图在没有转换的情况下在图像上绘制边界框时，框会出现在它应该在上方的像素，尽管在 x 轴上正确对齐。示例图片：https ://imgur.com/a/Ef4UPbd

当尝试以下我在几个线程上看到的转换解决方案时，Rect 完全消失了。

swift computer-vision ocr core-graphics visionkit

2021-10-12T05:42:10.480

0 投票

1 回答

172 浏览

ios - Swift 的 Vision 框架无法识别日文字符

我想使用 swift 的 Vision 框架从扫描的图像中读取日文字符。但是，当我尝试将识别语言设置VNRecognizeTextRequest为日语时

request.recognitionLanguages = ["ja", "en"]

我的程序的输出变成了无意义的罗马字母。对于日语文本的每个图像，都会有意外的识别文本输出。但是，当设置为其他语言（例如中文或德语）时，文本输出与预期相同。什么可能导致日本人似乎特有的意外输出？

我正在从这里的 github 项目构建。

ios swift vision visionkit

2021-10-12T21:03:13.270

0 投票

0 回答

71 浏览

ios - iOS15：Vision Framework VNCoreMLTransform 请求错误

执行 VNCoreMLModel 请求后，从 iOS 15 开始出现以下错误

iOS15之前我们使用的是

现在他们提供了类似的选项

VNRectangleObservation使用查找时遇到此问题observations

未找到 VNDetectorOption_OriginatingRequestSpecifier 所需选项

这种情况所需的 VNOption 是什么？有什么帮助吗？

ios swift uiimage vision visionkit

2021-10-31T16:00:55.593

0 投票

0 回答

34 浏览

ios - iOS15 VisionKit：VNRectangleObservation 返回 Nil 值

这是我使用 AVVisionRectangleRequest 查找矩形的代码

在 Catch Block 中，我遇到了错误。

未找到 VNDetectorOption_OriginatingRequestSpecifier 所需选项” UserInfo={NSLocalizedDescription=VNDetectorOption_OriginatingRequestSpecifier

ios swift image-processing visionkit

2021-11-08T10:45:12.343

1 2 3 4 5 6 7 8 9 10