我有一个分类器,可以预测零件是否会变坏。这些部分几乎相同,但仅略有不同。但是每个部分的重要性是不同的。例如,一个零件用于 5 台不同的机器,而下一个零件用于制造 100 台机器。第二个零件显然有与之相关的额外风险。我有一个模型可以预测零件是否会失效,该模型的阈值相当好。我如何简单地结合这种错误成本。我不想重新训练模型并且只有 RF/SVM 可用。
问问题
695 次
2 回答
3
如果我正确理解了这个问题(问题不是很严格)——你问的是如何让特定的机器学习模型更多地关注一些训练样本。至少有两种可能的方式来做这样的事情:
- 许多现有的机器学习模型具有“样本权重”,这可以迫使模型“更多地关注”特定的训练样本,同时允许对那些不太重要的样本进行错误分类。特别是 SVM 具有这样的功能,在sklearn中您只需
sample_weight
在创建SVM
分类器时设置 - 如果您使用某种交叉验证进行参数搜索,您可以使用加权评估函数,该函数将使用特定误报的“成本”知识,因此 - 您将选择最适合此加权度量的参数
于 2013-09-15T13:07:44.860 回答
0
如果已知失败的成本,为什么要将其纳入您的预测器?只需将其应用于您的输出。
于 2013-09-15T12:48:37.900 回答