问题标签 [firebase-mlkit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - 有没有办法通过火基地添加七段数字识别是Android ML套件?
我正在构建一个 Android 应用程序,其中需要从图片中识别七个段位并在处理数据后填充到屏幕上。
这需要在离线模式下进行。所以它需要在手机上运行
我看过 Tess,但它使应用程序的大小相当大,因此我想坚持使用 Firebase 上的 ML Kit。
有没有办法在现有的 ML Kit 文本视觉 API 中添加七段数字识别?
android - Ml Kit 检测不到护照机读区码?
我正在使用这部分代码进行检测,但无论我做什么,它都无法检测到机器可读区 (MRZ)。
是否有可能无法读取字体?如果是这样,是否可以选择添加字体?也可以将 Ml Kit 与 Tesseract 结合起来吗?
android - Firebase ML Kit:检查失败:'out_pix' 必须为非 NULL
我正在使用Firebase ML Kit Text Recognition API并收到在文本识别期间添加的错误:
当我按照建议将图像从转换jpg
为时bmp
,只是错误更改为:
以下是触发 API 的代码:
swift - 慢速人脸检测 Firebase MLKit
开始使用带有前置摄像头的 MLKit 人脸检测器,但处理人脸的速度真的很慢
我哪里错了?
xcode - 在没有 cocapods 的 iOS 上使用 Firebase ML Kit 时,GoogleMobileVision 中的链接器错误
我正在尝试将 Firebase 5.0.1 的 MLVisionTextModel 添加到没有 cocoapods 的 Xcode 项目中。我已经添加了 Readme.md 文件中所述的所有依赖框架。获取以下链接器错误:
Showing All Messages "_OBJC_CLASS_$_LAContext", referenced from: objc-class-ref in GoogleMobileVision(MDMPasscodeCache_f189776e75765630b82721fafea64052.o) "_vImageConverter_CreateWithCGImageFormat", referenced from: +[GMVUtility(Internal) sampleBuffer32BGRATo32RGBA:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) " _vImageConvert_AnyToAny", referenced from: +[GMVUtility(Internal) sampleBuffer32BGRATo32RGBA:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) "_vImageConverter_Release", referenced from: +[GMVUtility(Internal) sampleBuffer32BGRATo32RGBA:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) " _vImageBuffer_InitWithCGImage”,引用自:+[GMVUtility(Internal) rgbaPixelDataFromCGImage:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) "_vImageRotate_ARGB8888", referenced from: +[GMVUtility(Internal) rotatePixelData:width:height:bytesPerRow:withAngle:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o ) "_vImageHorizontalReflect_ARGB8888", referenced from: +[GMVUtility(Internal) flipRGBA8888Horizontally:width:height:bytesPerRow:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) "_vImagePermuteChannels_ARGB8888", referenced from: +[GMVUtility(Internal) permutate:width:height :bytesPerRow:order:] 在 GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) "_vImageFlatten_RGBA8888ToRGB888",引用自:+[GMVUtility(Internal) flattenRGBA8888ToRGB888:width:height:bytesPerRow:] in GoogleMobileVision(GMVUtility+Internal_1a3089c1f18dbb4046735909972b8cb2.o) ld:未找到架构 x86_64 的符号
任何帮助表示赞赏。
firebase - ML Kit for Firebase 可以用于手写文本吗?
关于 Firebase 的新 ML Kit,我从 Google 看到的所有示例都是识别“机器”文本,但我想知道是否可以使用新的 ML Kit for Firebase 来提取手写字符?
我认为不是,但我在文档或任何地方都找不到信息(而且我还没有尝试实际使用 ML Kit)。
android - 尝试添加 firebase ml 视觉图像标签模型时,Gradle 同步失败
尝试添加图像标签模型或张量流时,Gradle 同步失败,并显示以下消息:
有谁知道为什么会这样?
用于文本提取的 ML Vision 工作正常:
将 AS 3.2 Canary 15 与 android gradle 插件 3.2.0-alpha15 和 google play services 版本 3.2.1 一起使用。
android - 从 MVA 迁移到 MLK
4 个月以来,我一直在使用 Mobile Vision Android [MVA]开展一个项目。只需要使用播放服务和本教程Codelab。然而,自本月初以来,谷歌推出了新版本的机器学习工具包 [MLK],其中包含:
具有新功能。
和他们 :
强烈鼓励我们尝试一下
我的问题是新的 MLK 是基础Firebase。也就是说,我们必须使用 google dev 帐户,以及这个Setup和许多将我们的项目与 Google 紧密联系起来的烦人的东西(在我看来,如果我错了,请告诉我)。
我的第一个问题[@Ian Barber 回答]是:有没有办法在没有所有这些设置的情况下使用 MLK 和 firebase ?或者像我使用 MVA 的方式使用它,只需实现一个依赖项就可以了?
编辑: 我的应用程序正在使用[MVA]的Codelab。这意味着我能够检测到视频流中的文本(来自相机)。帧捕获、处理等的所有优化都被多个构造良好的线程考虑在内。但是现在没有使用[MLK]进行视频处理的示例。如果没有 MVA 功能,只需使用 MLK,Camera Source 和 Preview 的实现看起来几乎是不可能的。
我的第二个问题(根据迁移)是:如何使用CameraSource、CameraSourcePreview。就像我们在 MVA 中用于处理用于文本检测的相机源一样
android - 收到此错误“com.google.firebase.ml.common.FirebaseMLException:执行 Firebase ML 任务时发生内部错误”
在 onFailure 中获取 FirebaseMLException:执行 Firebase ML 任务时发生内部错误。
显现
machine-learning - 如何知道 Tensorflow Lite 模型的输入/输出特征信息?
我是移动开发者。我想将各种 Tensorflow Lite 模型(.tflite
)与MLKit一起使用。
但是有一些问题,我不知道如何知道.tflite
模型的输入/输出特征信息(这些将是设置的参数)。
有什么办法知道吗?
抱歉英语不好,谢谢。
更新(18.06.13.):
我找到了这个网站https://lutzroeder.github.io/Netron/。此可视化图表基于您上传的模型(例如.mlmode
等.tflite
)并查找输入/输出表单。