0

我有一个分类问题,我想预测一个结果,但希望我的分类器在答案中获得几次“尝试”(比如下单向赌注),而不是一个正确或不正确的分类,并且想知道最好的过程。

示例:给定结果 A、B、C 和 D,我想预测它将是“A 或 B”,或“A 或 C”,以及“正确”的解决方案(至少包含正确的个人答案)相应地影响学习过程。

到目前为止,我的想法是将数据集拆分成箱,或多或少如上(A 或 C)并以通常的方式训练分类器,或者训练多个分类器以使它们多样化,然后简单地组合结果,但我想知道是否有更好/不同的方法?我确信这不是一个独特的问题,但我不确定谷歌的正确术语。

我不知道这是否是一个相关的问题,但还有一种方法可以包含在“我不知道”选项中 - 即。不做分类?

4

1 回答 1

1

很多分类器可以做你想做的事。
朴素贝叶斯可以为您提供每个标签的概率,因此您可以获取 k 个最可能的标签,而不仅仅是单个最可能的标签并输出它。
Logistic Regression,SVM 还可以给你每个标签的分数,让你做类似的事情。
另一个技巧是稍微扰动输入特征向量并将其提供给分类器。重复几次,你得到的不是一个输出标签,而是几个。您可以按频率对它们进行计数和排序,以获得多个可能的答案。然后,您可以制定一些截止标准以仅选择这些标签的子集并将它们返回给用户。

于 2011-11-24T03:06:40.930 回答