我试图阅读这篇描述 ECT 算法的论文,但无法从中获得太多。
我知道它与一对一(oaa)不同,甚至比 oaa 表现更好。我想简单解释一下 ect 的工作原理。
我试图阅读这篇描述 ECT 算法的论文,但无法从中获得太多。
我知道它与一对一(oaa)不同,甚至比 oaa 表现更好。我想简单解释一下 ect 的工作原理。
ECT 和过滤树(仅)在您有大量输出标签(类)时有用,假设 N=1000。使用 OAA(一对一),这意味着对每个示例(在训练和测试期间)执行 N 个二进制分类任务。使用 ECT,您可以更快地进行预测:log(N)。您可以将过滤树(它是 ECT 的基础)想象成一棵决策树,在每个节点中,您询问示例是属于一组标签还是另一组标签(使用所有特征,与原始决策树不同)。
一般来说,ECT 比 OAA 更差(在损失或准确性方面)(但在某些情况下它可能几乎与 OAA 一样好)。对于 N=10 个标签,您应该先尝试 OAA。当 N>1000 时,OAA 太慢(甚至准确率也很低),您应该尝试 ECT(--log_multi
或者--csoaa_ldf
在 VW 中,如果您可以预先选择与每个示例相关的较少数量的标签)。