问题标签 [google-mlkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
223 浏览

ios - Google MLKit 人脸检测适用于 iPhone 6s,但不适用于 iPhone X

我在带有 Swift 的 iOS 上使用 Google 的 MLKit 进行人脸检测。我已按照入门指南进行操作。指南中的代码在我的 iPhone 6s 上运行,但在我的 iPhone X 上不起作用。结果证明它与 imageOrientation 函数有关。在我的捕获会话中,我对图像进行定向,以使像素数据与预期的方向(UIImage.Orientation.up)相匹配。我通过调试器检查输入到 MLKit 的图像来验证这一点。正如预期的那样,我 6s 上的 imageOrientation 函数返回 .up,但对于我的 X,它返回 .leftMirrored。为了临时解决这个问题,我将 visionImage.orientation 设置为 .up,但它仍然无法在我的 X 上运行。我还尝试了所有其他方向选项,但它们都不起作用。

下面是我创建的类的相关代码。关于我可能做错了什么的任何建议?

0 投票
0 回答
432 浏览

android - 在运行时下载 MLKit 人脸检测模型

我正在使用适用于 Android 的 MLKit 人脸检测 SDK 来检测用户面部的轮廓。

遵循本指南 ( https://developers.google.com/ml-kit/vision/face-detection/android ) 时,它展示了开发人员如何 (1) 将人脸检测模型文件捆绑到已编译的 apk 中,或 (2 ) 在运行时从 Google Play Services 下载人脸检测模型文件。

我正在尝试在各种嵌入式设备上运行这个 SDK。在所有这些设备中,如果我使用选项 (1),SDK 可以完美运行。如果我使用选项 (2),在我的某些设备上,人脸检测模型永远不会被下载。

当我使用选项 (1) 并编译我的 apk 时,我看到 MLKit 在我的 apk 文件的资产目录中捆绑了一个名为“models”的文件夹。“models”文件夹包含以下 .tflite、.tfl、.emd 和 .pb 文件:

在此处输入图像描述

所有这些引出我的实际问题的前奏:如果我自己将这些文件部署到设备上(在我配置设备时,或通过我自己的下载机制),我可以指示 SDK 在哪里查找它们吗?或者我可以将这些文件作为自定义模型上传到 Firebase,以便我可以自己控制下载(如果我将这些文件作为自定义模型上传到 Firebase,我需要上传哪些文件——所有这些文件?)

明确一点:虽然我可以使用上面的选项 (1) 并且它有效,但我试图让我们的 apk 文件尽可能小,并且排除模型文件会使我的 apk 大小减少 ~16 MB。

谢谢!

0 投票
1 回答
1251 浏览

android - ML Kit 文本识别:如何根据图像中的位置获取文本?

我正在为自己制作一个应用程序来扫描收据,并将数据放入数据库中。我尝试使用 ML kit 文本识别,效果很好。但是,我在从识别的文本中提取数据时遇到问题。我会用一个例子来解释:

这是收据的格式,这就是我想要获取数据的方式:

然而,在运行文本识别时,它会以非常奇怪的方式格式化数据。例如,上面的收据会给出这些块:

它似乎跳过了金额列中的单个数字,但我可以解决这个问题。但是我不知道如何将上述数据解析为我想要的数据,尤其是将价格与名称联系起来。有没有办法改变块,使它只需要收据的行或列,而不是这种随机性?

编辑:当使用线条或元素而不是块时,我得到以下结果:

但是我仍然有同样的问题:如何将商品与正确的价格配对?

0 投票
1 回答
292 浏览

android - 是否可以使用 firebase ML 套件检测性别

是否可以使用 firebase ML kit 检测性别,如果可能的话给我一些建议和资源

0 投票
0 回答
269 浏览

android - Beauty Mode with CameraX

I have been searching for beauty mode since last week and didn't find any resource except for some overpriced sdk. I want to know if there is any tool or resource which helps me to implement beauty mode in-camera preview like slim face, skin tone, eye size, etc.

what I found:

I found this Vendor extension - "BeautyImageCaptureExtender" but there is no official documentation in detail about this except enabling this on supported devices.

I know that we can detect face with Google ML Kit or we can use Android AR Core to apply image effects.

It would be a great help if anyone can help me with this.

enter image description here

0 投票
1 回答
636 浏览

firebase - MLKit 旋转面部图像使其笔直(iOS 和 Android)

我正在开发一个使用 Firebase 的 MLKit 进行人脸检测的应用程序。然后我获取检测到的人脸并通过自定义 tensorflow 模型运行它

问题是我的自定义张量流模型期望面部是直的。如果用户的脸完全旋转,我不会得到准确的结果

有什么方法可以旋转面部图像使其笔直?我将如何使用 MLKit 做到这一点?

我目前获取人脸图像的方法是使用 AVCaptureSession (iOS) 并根据 mlkit 在人脸对象中给我的边界剪切图像。它可以工作,但如果用户的脸不直,我最终会得到一个旋转的脸

0 投票
1 回答
43 浏览

android-studio - How can i trace eating with mouth closed using Google ML Kit

Currently i tried to calculate distance between UPPER_LIP_BOTTOM and LOWER_LIP_TOP, and i set the threshold value 23 (Calculated by minimum distance between both UPPER_LIP_BOTTOM and LOWER_LIP_TOP), if current distance go above the THRESHOLD it will show "Eating" but this method is not working when i am eating with my mouth closed.

0 投票
2 回答
821 浏览

ios - 通过 CocoaPods 使用 GoogleMLKit 0.61.0 将 Firebase 库降级到 6.20.0

通过 CocoaPods使用GoogleMLKit 0.61.0 正在将 Google Firebase 库从我项目中定义的最新库降级到下面详述的旧版本

我的播客文件:

根据更改日志,它对 Firebase 没有任何依赖关系,但是当我尝试使用它时,它也在更新 firebase。而且我们不能使用旧的 Firebase 版本,因为我们在那里遇到了很多问题和崩溃

对此的任何帮助将不胜感激

0 投票
1 回答
192 浏览

image - 替换独立 ML Kit SDK 的 FirebaseVisonImageMetadata

我一直在从 Firebase ML Kit 迁移到新的独立 ML Kit。

在创建时,FirebaseVisionImage我曾经将旋转传递为FirebaseVisionImageMetadata.ROTATION_180,但根据文档FirebaseVisionImageMetadata该类已被删除。

使用新的 SDK 类时如何设置旋转值?

旧代码:

0 投票
1 回答
591 浏览

android - 与 firebase ml vision 相比,使用 Firebase ml vision 条形码模型获得更少的条形码值

我正在开发一个应用程序,我需要从图像中提取文本和条形码值。为此,我正在使用 Firebase ML Kit。

我在build.gradle中添加了以下依赖项

AndroidManifest.xml

现在的问题是,当我同时使用两者时,我在扫描图像后得到的条码结果数量较少,但如果我只使用firebase-ml-vision:24.0.3,那么我得到的条码结果数量更多。firebase-ml-vision-barcode-model:16.1.1firebase-ml-vision:24.0.3

实施时有什么问题还是我做错了?