给定 D=(x,y), y=F(x),似乎大多数机器学习方法只输出 y 作为单变量,无论是标签还是实数值。但我面临的情况是 x 向量可能只有 5~9 维,而我需要 y 是一个多项分布向量,最多可以有 800 维。这使问题变得非常棘手。
我研究了多任务机器学习方法中的很多东西,我可以同时训练所有这些 y_i。当然,另一种愚蠢的方式是我也可以单独训练所有这些维度,而不考虑任务之间的联系。但问题是,在查看了很多论文之后,似乎大多数 MTL 实验只处理 10~30 个任务,这意味着 800 个任务可能很疯狂而且很难训练。也许集群可能是一个解决方案,但我真的很好奇任何人都可以就其他方法来处理这个问题提出一些建议,而不是从 MTL 的角度来看。