machine-learning - 以假阴性为代价对机器学习预测进行加权

Question

我有一个分类器，可以预测零件是否会变坏。这些部分几乎相同，但仅略有不同。但是每个部分的重要性是不同的。例如，一个零件用于 5 台不同的机器，而下一个零件用于制造 100 台机器。第二个零件显然有与之相关的额外风险。我有一个模型可以预测零件是否会失效，该模型的阈值相当好。我如何简单地结合这种错误成本。我不想重新训练模型并且只有 RF/SVM 可用。

score 3 · Accepted Answer

如果我正确理解了这个问题（问题不是很严格）——你问的是如何让特定的机器学习模型更多地关注一些训练样本。至少有两种可能的方式来做这样的事情：

许多现有的机器学习模型具有“样本权重”，这可以迫使模型“更多地关注”特定的训练样本，同时允许对那些不太重要的样本进行错误分类。特别是 SVM 具有这样的功能，在sklearn中您只需sample_weight在创建SVM分类器时设置
如果您使用某种交叉验证进行参数搜索，您可以使用加权评估函数，该函数将使用特定误报的“成本”知识，因此 - 您将选择最适合此加权度量的参数

score 0 · Accepted Answer

如果已知失败的成本，为什么要将其纳入您的预测器？只需将其应用于您的输出。

machine-learning - 以假阴性为代价对机器学习预测进行加权

2 回答 2

Related

Reference