我有一个来自 create ML 的机器学习分类器。该模型使用 3400 个样本进行训练,总体而言其准确度令人印象深刻。然而,该模型经常做出错误的预测,我似乎无法弄清楚如何将其添加到模型中,因此它对其中一些错误预测没有如此高的信心。我如何/我可以用这个分类错误的新数据重新训练模型,它不属于这个分类?我应该创建一个新的分类文件夹并向其中添加这些错误的分类,还是有办法训练模型以作为非分类类型传入,以便尝试理解它们之间的区别?
问问题
1245 次
1 回答
3
免责声明:到目前为止,我还没有使用 createML。正如我从问题中了解到的那样,您通过文件夹结构提供训练数据,然后通过按下按钮完成训练和评估。如果我做了一些错误的假设,请纠正我。
很高兴知道您正在使用哪种模型/架构以及您的训练样本的外观。
对我来说,您的问题听起来像是这些预测不佳的样本在您的整个数据集中可能代表性不足。您可以在这里尝试一些技巧:
- 只需为您的训练过程复制(在您的训练样本文件夹中复制粘贴)这些样本,以便将这些特定样本的错误反馈加倍。
- 一种更复杂的方法是对这些样本应用数据增强策略,然后将增强的样本添加到您的训练数据集中。
根据您的示例类型,有可用的 Python 扩充包,它们使用起来非常简单直接。
于 2019-11-07T14:42:23.320 回答