0

所以我是 ML 的新手,我有一个任务,我需要能够用我手机的摄像头识别一个特定的对象并在那一刻触发一个动作。我已经到了能够训练模型、将其与 Google 提供的示例 Android 应用程序连接并运行它的地步。所有这些都与我从不同站点下载的一些数据集完美配合,狗或花之类的东西都可以正常工作。现在,我正在尝试使用一组包含一个简单对象的图像来训练模型,在此示例中,我使用的是索尼蓝牙扬声器 XB12B。我在不同的环境中为它拍了一堆照片,但是当我训练模型时,我总是得到 1 的准确度,当我在手机中使用图像标签使用该模型时,它看到的任何东西都是 100% 的那个对象。

我只用一门课来训练模型。

正如我提到的,我是新手,我不确定我做错了什么,如果是对象的形状,数据集中缺少更多元素或我缺少的其他参数。非常感谢你们可能有的任何见解或线索

干杯

4

1 回答 1

0

您必须使用现有数据集 + 标记为“说话者”的新图像集来训练模型(为了这个示例)。如果你训练一个只有 1 个类别的模型,它将学会预测“这个物体离说话者有多近?” 对于它找到的每个对象,而不是“这是扬声器吗?”。

您至少需要使用 2 个类别 - 将演讲者图像标记为“演讲者”,其余图像标记为“其他”,或者您需要使用 2 个以上的类别 - 将演讲者图像标记为“演讲者”,其余图像根据分配的类别标记“狗”、“猫”等

于 2021-01-11T21:51:13.927 回答