这是一个关于训练 ML 模型来检测卡片的更通用的问题。
这些卡片是儿童游戏,有 4 种不同的颜色、数字和符号。我不需要检测颜色,只需检测卡片的值(又名符号)。
我尝试用我的 iPhone 为每张卡片拍照,使用 RectLabel 在左上角的符号周围绘制矩形(卡片的右下角也有一个倒置的符号,我没有将这些标记为它们将在检测过程中被隐藏)。我裁剪了图像,因此只有卡片可见,没有周围环境。
然后我将我的图像上传到 app.roboflow.ai 并让它们发挥作用(使用自动定向、调整为 416x416、灰度、自动调整对比度、旋转、剪切、模糊和噪声)。
这给了我另一组图像,我用这些图像用 Apple 的 CreateML 训练我的模型。
但是,当我在我的应用程序中使用该模型时(我正在使用 Apple 的早餐查找器演示),未检测到卡片值 - 嗯,有时它可以工作,但仅在与手机有一定距离的情况下,并且标签是倒置或侧身。
我的猜测是这是因为我的图像没有按照应有的方式拍摄?
关于我必须如何设置整个事情以便我的模型得到良好训练的任何提示?