问题标签 [firebase-mlkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
barcode-scanner - 实时条码扫描仪 Firebase
我在使用 ML 套件中的 firebase 条形码扫描仪时遇到问题。在文档中没有关于实时条形码扫描仪的线索。我的意思是有一个图像解决方案,但我想用相机立即完成而不拍照。是否有可能或firebase条形码扫描仪仅用于图像?
ios - Firebase MLKit 文本识别失败,前置摄像头 iOS
我已经Firebase MLKit SDK
根据文档集成了文本,可以正确检测到back camera
照片中的文本。当我使用从前置摄像头拍摄的照片时,文本检测错误并且出现不良结果。
我无法弄清楚。我需要更换相机或 firebase ml 套件吗?
android - CamCard 之类的应用程序可从图像中识别文本并填写表格
我想创建一个类似 CamCard 的应用程序,它将作为 ocr 工作并将文本填充到特定字段中,我已经使用 Firebase MLKit 从图像中识别文本,但问题是它现在给我文本作为列表如何获取哪些文本与哪个相关我的基本实现如下
从上面的侦听器中,我将获得所有文本的列表,请演示如何将文本设置为相应的字段
android - 机器学习套件 - Android - 文本识别 - 文本方向
我开始了一个新的文件编号文本识别应用程序,我在 Youtube 上使用了以下 ML Kit 文本识别: Tutorial ML KIT Text Recognition
只要文件编号是水平写入的,它就可以完美地工作。当文本垂直定向并且我将手机置于横向位置时,应用程序会考虑方向并且文本识别不再起作用。
我试图同时添加
在清单中,
setRequestedOrientation(ActivityInfo.SCREEN_ORIENTATION_PORTRAIT)
甚至
setRequestedOrientation(ActivityInfo.SCREEN_ORIENTATION_NOSENSOR)
进入 onCreate 方法。即使手机处于横向位置,活动也会保持纵向模式。但是,在横向使用我的手机时,文本识别仍然不起作用。
Activity 代码的对应部分如下:
有没有人有一些技巧可以让它工作或知道一个有效的教程?我在这里看到了一个示例:Firebase 示例,其中他们使用 media.Image 对象来考虑方向。由于我不知道如何修改原始代码(使用位图),我只是试图“停用”方向传感器,以便拍摄的图像/位图完全相同,无论我是纵向使用手机还是横向位置。在这种情况下,recognizeText(bitmap) 方法应该在两种情况下返回相同的答案。
android - 在 Compute/Isolate 函数中运行 Firebase ML Vision API 调用
我一直在玩 Firebase ML Vision https://pub.dartlang.org/packages/firebase_ml_vision并且到目前为止已经在我的应用程序中集成了文本识别。我的问题是我的 UI 是实时摄像机源,每次调用 Firebase ML 视觉时,我都会看到大约 1-2 秒的延迟/冻结,这会影响我的 UI。我设法将其缩小到 Firebase ML API 中的这行代码
从那以后,我尝试实现对 API 的整个调用,从将捕获从相机源发送到 FirebaseVisionDetector 对象,但是如果我没记错的话,没有用,但如果我没记错的话,类似例程之类的东西必须从主要隔离。我可以在没有这个 API 的情况下成功实现计算功能。我有一种感觉,这与它是一个外部软件包有关。
任何帮助都将不胜感激,因为我正在寻求应用程序内的流畅 UI 交互和过渡。
android - 将位图转换为 Firebase ML 套件的 N*N*N*N 字节数组
我正在尝试使用 android 相机将图像作为输入提供给使用 Firebase ML Kit 的卷积神经网络模型。
我已经将模型上传到 Firebase(作为 tf lite 模型)。
我的模型将 (56, 75, 3) 像素图像作为输入,并尝试将图像分类为 4 类。
我正在努力正确调整位图的大小以适合字节数组 {1, 56, 75, 3}
如何将位图转换为 [1][56][75][3] 字节数组,以便将位图输入模型?
qr-code - 如何使用 Firebase 创建 QR 码?
是否可以使用 Firebase 创建二维码?
我想创建一个二维码,用于与其他人共享 pdf 文件。Firebase 似乎有这样的功能,但我不知道在哪里生成代码......
ios - Firebase ML Kit 超过 GitHub 的文件大小限制
我的主要问题如下:Firebase ML Kit SDK 是否普遍超过 GitHub 的文件大小限制,因此不允许推送到 GitHub 远程?我错过了什么 - 如果是这样,是否有一个常见的解决方法?
我的问题具体如下:
remote: error: File Pods/GoogleMobileVision/TextDetector/Frameworks/TextDetector.framework/TextDetector is 265.89 MB; this exceeds GitHub's file size limit of 100.00 MB
如您所见,GoogleMobileVision
的TextDetector
框架非常大。
一些细节:
- 目前,我只使用 Firebase ML Kit 中的文本识别
我的 Podfile 如下(取自 Firebase 安装文档):
/li>
此应用仍在开发中,尚未部署到 App Store 或其他任何地方。我愿意按照建议使用 Git 大文件存储 (LFS),只是想知道这是否绝对必要。对于使用此方法的每个人都必须采用这种方法,这似乎有点奇怪。
非常感谢您提供任何信息/专业知识。
更新:我联系了 Firebase 支持;他们反应迅速,并回复了以下回复:“你说得对,ML Kit 框架可能比其他框架更大,因此可能需要你选择 Git LFS。不过感谢您的反馈,我会注意的这个的。”
android - 无法调整 Firebase (Google) MLKit 人脸检测的准确性
我正在编写一个 android 相机应用程序,并且正在使用 MLKit on-device API 进行人脸检测。这个 API 的好处是启动和运行非常简单,并且有一个示例应用程序展示了如何执行此操作,但感觉它的功能非常有限。
我的问题是我得到了太多误报(低精度),这似乎不是我可以控制的。我可以设置的唯一选项modeType
是要么是FAST_MODE
要么ACCURATE_MODE
。但我真正需要的是一些我可以调整的旋钮,以获得所需的精度和召回组合。
有谁知道我是否可以使用 API 来获得对最终结果的额外控制?
android - ML Kit FaceDetectionProcessor 未检测到耳朵标志
问题详情
我从这里尝试了 ML Kit 人脸检测示例应用程序,但在运行 LiveDataPreviewActivity 时无法接收耳朵的地标数据。
对于 FirebaseVisionFaceLandmark.LEFT_EAR 和 FirebaseVisionFaceLandmark.RIGHT_EAR,调用 face.getLandmark 始终返回 null。所有其他地标都被突出显示并很好地检索。
(在 Google Pixel 和三星 S6 上测试)
还有其他人遇到过这个问题吗?检测耳朵是否需要一些额外的设置?...我还在 repo 中添加了一个 github 问题,但我认为 stackoverflow 社区更加活跃。
相关代码
...地标值始终为空。