firebase-mlkit - 如何使用 Firebase / ML Kit 识别和计数对象

Question

我想识别和计算图片中的对象，例如计算社区图片中的房屋数量。使用 ML Kit 执行此操作的最佳方法是什么？

我需要使用对象检测 API吗？或者是否可以使用直接的图像标记器获得多个“房屋”标签？

score 5 · Accepted Answer

ML Kit 对象检测 API （请注意，它现在作为独立 SDK 提供）可以计算图像/视频流中的对象，但仅限于 5 个最大的对象。此外，您应该评估对象检测是否适用于您的用例。它是一个非常通用的定位器，适用于大多数对象，但是当对象靠近/重叠时，它可能无法区分它们。

如果您需要检测超过 5 个对象，我建议您直接使用TensorFlow Lite和 TF Hub上提供的一些预训练模型进行查看，或者如果通用模型不适合您的用例，则使用AutoML Vision Edge 自行训练.

Fwiw，图像标签分配描述图像场景的标签。但是，它不计算对象的数量，您通常会得到一个标签“房子”。

1 回答 1