我正在研究一个机器学习问题,其中我有一个多标签目标,其中每个标签都是一个概率。过去我曾处理过多标签问题,但每个标签都是二进制的。例如,如果目标是一系列书籍主题('Python'、'Machine Learning'、'Fairy Tales'、'Cooking'),则基于 Python scikit learn 的机器学习书籍的目标是 [1, 1, 0, 0]。
现在,对于我要解决的问题,我的目标不是二进制的。目标本身是一系列概率,如 [0.75, 0.25, 0, 0]。我认为目标是以众包方式产生的,这些概率反映了人们判断的可变性。因此,除非我想在类中存储概率(即 p<0.5 ->0,p>=0.5 ->1),否则我会遇到一个回归问题,即目标需要限制在 0 和 1 之间。任何想法我可以尝试哪种算法?我正在使用 Python 的 scikit learn。
谢谢!