4

我有一个包含 2 个标签的数据集,我知道这两个标签之间存在很强的相关性。但是,当我使用不考虑相关性的 scikit multilearn 二元相关性时,我得到的结果与考虑这些标签相关性的 Labelpowerset 分类器非常相似?对此有何评论?除了我使用http://scikit-multilearn.github.io/ 我不知道它有多有效?

4

1 回答 1

1

我是 scikit-multilearn 的作者。为了回答您的问题,我需要查看标签组合图。两个标签产生 4 种组合,但如果组合 [1,0] 和 [0,1] 在 [0,0] 或 [1,1] 的情况下占主导地位,那么您可能会遇到 Label Powerset 无法正确学习相关案例的基分类器。它还取决于您使用哪种方法来验证性能?

于 2016-02-18T16:23:32.657 回答