我正在尝试解决一个简单的分类问题,其中标签有 12 个不同的级别,并且需要将每个示例分类为这 12 个级别中的一个。但是,我希望我的输出看起来像参考图像:
http://i.stack.imgur.com/49USG.png
这里; 假设我设置了 20% 的置信度阈值;我希望我的输出包含每个 id 的所有标签,这些标签高于 20% 并且是有序的(最高置信度优先)。如果没有一个标签超过 20%;然后是默认标签。更具体地说,Rapidminer 中是否有任何现有的运营商可以提供这样的输出?
我正在尝试解决一个简单的分类问题,其中标签有 12 个不同的级别,并且需要将每个示例分类为这 12 个级别中的一个。但是,我希望我的输出看起来像参考图像:
http://i.stack.imgur.com/49USG.png
这里; 假设我设置了 20% 的置信度阈值;我希望我的输出包含每个 id 的所有标签,这些标签高于 20% 并且是有序的(最高置信度优先)。如果没有一个标签超过 20%;然后是默认标签。更具体地说,Rapidminer 中是否有任何现有的运营商可以提供这样的输出?
每当Apply Model
操作符运行时,它都会生成与标签属性的各个值的置信度相对应的新特殊属性。因此,如果标签有值one, two, three
,将创建三个新属性confidence(one), confidence(two), confidence(three)
。可以使用Generate Attributes
运算符制定一些逻辑来决定如何真正对每个示例进行分类。也可以使用Apply Threshold
运算符 (with Create Threshold
) 来做类似的事情。除非您发布带有数据的代表性示例,否则无法提供更多指导。