问题标签 [mlvision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
567 浏览

firebase - Firebase/MLVision 未通过 Pods iOS 安装

我正在尝试将 Firebase/MLVision 添加到我的 iOS 应用程序中,但运行 pod install 给了我这个:

我该怎么办?任何形式的帮助都非常感谢!

0 投票
1 回答
797 浏览

swift - MLVision 旋转不正确

尝试在纵向模式下使用 MLVision,但是在我以纵向模式拍照后,由于旋转不正确,它只会输出几个字符。图片必须在横向拍摄,否则无法识别文字。试图查看 Firebase 提供的示例,当这种情况发生在横向和纵向工作时,我遇到了完全相反的问题,但是除了元数据之外,我无法找到决定图像方向的设置,我试图改变但没有任何成功。

0 投票
1 回答
1160 浏览

firebase - 在 Firebase ml 视觉颤动中,人脸对象的属性始终为空

我按照这个自述文件中的所有说明进行人脸检测,当我尝试访问人脸的属性时face.leftEyeOpenProbabilityface.rightEyeOpenProbability或者face.smilingProbability它让我为空,尽管检测到了人脸

我尝试通过两种方式解决此问题,
1. 使用旧的 firebase_ml_vision 插件进行颤振(与 AndroidX 不兼容)
firebase_ml_vision: ^0.2.1,其中使用了该功能detectInImage()

2.使用新的firebase_ml_vision插件(与AndroidX兼容)
firebase_ml_vision: ^0.6.0+2在使用该功能的地方processImage()

在这两种方法中,属性值都是 null

这是使用最新插件检测人脸的片段。

请帮我解决这个问题。

0 投票
0 回答
39 浏览

android - 如何将 ML Vision OCR 结果结构化为表格格式?

我正在使用Firebase ML Vision从图像中识别文本。我得到了相当不错的输出。对于图像,是输出。我想以表格格式构造这个输出,就像它显示在图像中一样,有边界框,矩形。但我不知道该怎么做。有人可以帮助我实现这一目标吗?

0 投票
1 回答
911 浏览

ios - 无法使用 firebase ML 套件检测眨眼事件

我正在使用 Firebase ML-Kit 进行人脸检测,现在我想实现眨眼,但我无法检测到眨眼。我总是得到 leftEyeOpenProbability 和 rightEyeOpenProbability 1.0。我正在使用与https://github.com/firebase/quickstart-ios/tree/master/mlvision相同的以下代码

请帮助我如何实现眨眼功能。

0 投票
1 回答
56 浏览

android - 使用支持库在项目中导入 ML-Vision 库

implementation 'com.google.firebase:firebase-ml-vision:23.0.0' 是否可以在未迁移到 AndroidX 库的项目中添加以下依赖 项?

我试了一下,看来我必须迁移到 androidx,我现在不想这样做。还有其他选择吗?

0 投票
1 回答
441 浏览

firebase - Firebase Ml Vision 无法识别 Image Picker Plugin 拍摄的图像

我正在使用 firebase_ml_vision 包进行文本识别。它在 Android 端工作,但是当我测试它时,使用 image_picker 插件拍摄的真实 IOS 设备无法识别文本。我尝试转换为图像 Unit8 并且同样的问题不读取图像。

我需要转换图像吗?

这是我的图像选择器功能

这是我的 ml_vision 识别文本功能。

0 投票
1 回答
235 浏览

flutter - Firebase ML Vision TextRecogniser 修改结果以获得更好的搜索

我在 Flutter 应用程序中不断遇到 Firebase Ml-Vision 的问题,结果不准确。现在我明白总会有一些平衡的准确性会丢失,但我正在尝试找出一种方法,我至少可以尝试规避一些更明显的问题。

由于我需要搜索标牌文本以查看它是否与特定的预定义字符串列表匹配,因此我试图找出一种方法,我可以采用特定单词(例如下面提到的单词)并创建所有排列的列表,其中以下字母和数字被考虑在内:-

  • 0=O 和 O=0
  • 1=l 和 l=1
  • 2=z 和 z=2
  • 5=s 和 s=5
  • 6=b 和 b=6
  • 7=T 和 T=7

问题是一些字母或数字被它们看起来相反的字母或数字所取代。例如:单词“slob”可以被 OCR 读取为“5lob”、“s1ob”、“sl0b”、“slo6”甚至“5106”。

我不确定颤振/飞镖中是否有一些烘焙函数可以帮助解决这个问题。我唯一拥有的是一堆非常讨厌的嵌套 for 循环。我觉得必须有一些优雅的方式来实现这一点。这种算法甚至有一个术语吗?

0 投票
1 回答
439 浏览

flutter - 将 base64 字符串编码的图像/字节图像作为图像传递,以便在 Flutter 中的 Firebase ML Vision 中进行处理

我想从 base64 编码的图像中 OCR 文本。我知道图像有效,因为我可以使用

Image.memory(base64Decode(captchaEncodedImgFetched))

现在,问题是我需要将此图像传递给 Firebase ML Vision 进行处理。

该库firebase_ml_vision有一个使用文件中的图像的示例

但是我有一个 base64 编码的图像。

我尝试了以下

但它似乎需要 FirebaseVisionImageMetadata()作为一个论点,但我对字节图像一无所知。

这门课需要更多我不明白的论点。例如,它需要一个size : Size(width, height)参数。图像不是应该已经有尺寸了吗?为什么我需要再次指定它?

现在我将它设置为Size(200, 50). 然后还有其他论点,我不知道该传递给他们什么。例如planeDatarawFormat

以下是这些文档:

https://pub.dev/documentation/firebase_ml_vision/latest/firebase_ml_vision/FirebaseVisionImageMetadata-class.html

https://pub.dev/documentation/firebase_ml_vision/latest/firebase_ml_vision/FirebaseVisionImagePlaneMetadata-class.html

https://pub.dev/documentation/firebase_ml_vision/latest/

0 投票
0 回答
351 浏览

firebase - ML Vision 文本无法纵向工作

我遇到了 Flutter firebase_ml_vision 的问题。在 iPad Mini 2 上进行测试时(过去在 android 上看到过),以人像模式拍照时未检测到文字。它似乎在景观中工作。当我在 Native Android 中编写原始应用程序时,我遇到了完全相同的问题(我后来决定在 Flutter/Dart 中制作它)

我现在花了几个小时试图弄清楚这一点。这似乎是一个已知问题,但对解决方案没有普遍共识。

我最接近它的工作是使用这个 SO fixExifRotation() 函数,但是读取的文本是加扰的。

有没有人遇到过这个问题并找到了可行的解决方案?