问题标签 [firebase-mlkit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1270 浏览

android - 如何为谷歌的 MLKIT 使用图像格式 YUV_420_888

ImageReader 从相机预览中获取每一帧都是具有格式的图像YUV_420_888,我想将其用作 MLKIT 的输入。

在谷歌的文档中,我可以运行检测器,输入为:

  • 位图
  • 媒体.图像
  • 字节缓冲区
  • 字节数组
  • 一份文件

我尝试转换YUV_420_888为上述对象,但失败了

0 投票
1 回答
658 浏览

android - Firebase ML Kit - 各种字母的字符识别支持?

Firebase ML Kit 中包含的字符识别 API 是否支持不同的字母?我还测试了英文字母、法文字母和西里尔字母,以及在 Android 上执行以下代码后返回的字符:

总是来自英文字母表的拉丁字符,即任何公认的法语或西里尔字符都被替换为似乎最匹配它们的拉丁字符。

是否有可能实现对此类字符的正确识别?

谢谢你。

0 投票
2 回答
2674 浏览

android - 使用 SurfaceView 中的 ByteBuffer 时如何在 android ML-kit 中暂停条形码扫描

语境

我正在使用 Android firebase-ml-vision使用带有连续 ByteBuffer 相框的 SurfaceView 扫描条形码。我使用ML kit quickstart 项目作为起点,它运行良好。

我的项目的目标是识别与条形码相关的产品并将其添加到扫描项目列表中。

问题

一旦相机对焦,条码处理器将多次检测到同一个条码,因此您将在一秒钟内扫描 20 个而不是 1 个条码。

这是来自CamereSource.FrameProcessingRunnable.run的 javadoc

我试图在 FrameProcessingRunnable 中添加一个“暂停”检查,但我仍然得到至少两次识别相同的条形码,因为下一帧/帧已经被输入以进行检测:

使用停止和启动的解决方案

因为我无法让它暂停,所以当从缓冲区检测到条形码时,我选择了停止和启动:

这可行,但是在再次启动之前大约有 1 秒的延迟,相机开始对焦并且可以检测到下一个条形码。毫无疑问,这种方法也会消耗不必要的资源。您可能会说这很好,但在本视频中,您将看到带停止和启动的相机扫描仪和蓝牙扫描仪之间的区别

更好的方法

我正在寻找一种解决方案,它可以在成功检测的帧之后立即丢弃任何帧并重新开始,但到目前为止我失败了。我每秒使用 20 帧。

VisionProcessorBase确实有节流代码

但是对于我的需要还远远不够:(

0 投票
0 回答
204 浏览

firebase-mlkit - 我可以在位图中复制 face.getboundingbox() 内的原始面(像素)吗?

我正在查看 ML Kit 中的 FaceDetection 示例,我想复制已识别人的面部(可能使用 GraphicOverlay?)。有什么办法吗?我不仅对面部标志感兴趣,而且对实际的面部本身感兴趣。

我试过这个(我在 GraphicOverlay 类中使​​用了这个方法,然后在 onSuccess 方法的第一件事上在 FaceDetectionProcessor 类中调用它,但是当我尝试在内部保存它时得到一个空的“白色”jpeg):

}

识别的真实面孔

0 投票
0 回答
447 浏览

android - 使用 Firebase ML Kit 扫描 GZIP 压缩的二维码

我正在尝试扫描 GZIP 压缩的二维码二进制值,但我从大多数扫描仪中得到了未知的编码。

QR 值:ABCDEFGHI,UTF-8 编码,GZIP 压缩。

我尝试对 zxing、zbar 和现在的 ML Kit 做同样的事情。检测后的响应是“未知编码类型”。我听说我们需要开发自己的扫描仪来做到这一点。我将如何继续实施呢?我将如何扫描压缩的 Gzip 二维码,其他扫描仪是否有助于解决此问题?图片 - QR 值:ABCDEFGHI、UTF-8 编码、GZIP 压缩

二手 ZXING、ZBAR、GOOGLE MOBILE VISION 和 ML KIT,没有预期输出

0 投票
1 回答
325 浏览

firebase-mlkit - 可以使用firebase facedetection进行身份验证

我想在 Android 中使用 Firebase 人脸检测。据我所知,它可以检测人脸。我可以保存检测到的人脸并下次进行比较以进行身份​​验证吗?

0 投票
2 回答
944 浏览

ios - 用于 iOS 中文本检测的 Firebase MLKit 错误

我想在我的 iOS 应用程序中使用 firebase 的 MLKIT(用于文本识别)。我有下载和测试示例应用程序。但是当我在我的自定义项目中使用 core ml 时,我从 iPhone 相机捕获图像并在此图像上使用 ML Kit 函数调用,MLKit 不会向我显示任何结果。您能告诉我为什么它使用默认图像但在使用捕获的图像时无法生成结果吗?

0 投票
4 回答
5768 浏览

android - MLKit Firebase android - 如何将 FirebaseVisionFace 转换为图像对象(如位图)?

我已将 MLkit FaceDetection 集成到我的 android 应用程序中。我在下面提到了网址

https://firebase.google.com/docs/ml-kit/android/detect-faces

人脸检测处理器类的代码是

在“onSuccess”监听器中,我们将获得“FirebaseVisionFace”类对象的数组,这些对象将具有“边界框”的面。

我想知道如何将此 FirebaseVisionFace 对象转换为位图。我想提取人脸图像并将其显示在 ImageView 中。谁能帮帮我吗 。提前致谢。

注意:我已经从下面的 URL 下载了 MLKit android 的示例源代码

https://github.com/firebase/quickstart-android/tree/master/mlkit

0 投票
1 回答
1973 浏览

java - 如何使用 opencv 编辑图像以使用 OCR 读取文本

我正在开发一个 android 应用程序来识别特定板块中的文本,如下图所示:

盘子

我必须识别白色的文本(例如“Mod.”附近)。我正在使用 Google ML Kit 的文本识别 API,但它失败了。所以,我正在使用 OpenCV 编辑图像,但我不知道如何强调(白色)文本以便 OCR 识别它。我尝试了更多的东西,比如对比度、亮度、伽马校正、自适应阈值,但根据照片的拍摄方式,情况会有很大差异。你有什么想法?非常感谢。

0 投票
1 回答
637 浏览

android - 为什么 MLKIT 中的“检测人脸”会导致内存泄漏?

我编写了一个关于相机的应用程序,使用来自相机的每张图像,我将其传递给班级BarCodeDetectFace检测条形码或面部。但是当我使用DetectFace.

如果我使用它是安全的BarCode

但是如果我使用DetectFace,这会导致内存泄漏:

这是类DetectFace