0

我在我的一个 android 应用程序中使用 Firebase Vision Image。每当 android 模拟器拍照时,Firebase Vision Image Labeler 都会返回来自相机捕获的位图的标签列表。

我的问题是标签几乎不准确。例如,如果我拍一张脸,它会返回一个 80% 置信度的标签,上面写着“狗”。但是,当我拍摄一张人脸并将其插入 Google 的 Cloud Vision(Firebase 建立在其网站上)Demo labeler 中时,它会返回更准确的响应。

为什么 Firebase Vision 响应/标签与 Google Cloud Vision 响应/标签有很大不同?

顺便说一句,我正在拍摄的照片在我的笔记本电脑上。

4

1 回答 1

1

Firebase ML Kit 的设备上标签检测运行分辨率低于 Cloud Vision API 的 ML 模型。结果,它可以检测到更少的标签,并且可能以较低的准确度检测它们。

从有关在设备上和云 API 之间进行选择的文档中:

标签覆盖率

在设备上:400 多个标签,涵盖照片中最常见的概念。见下文。

云:许多类别的 10,000 多个标签。见下文。

如果您希望模型检测到的准确度最高,则应使用 Cloud Vision。但这确实意味着用户必须拥有有效的互联网连接,并且您将使用付费的 Cloud Vision API,而不是免费的设备上模型。

于 2020-05-05T13:55:15.283 回答