0

给定 D=(x,y), y=F(x),似乎大多数机器学习方法只输出 y 作为单变量,无论是标签还是实数值。但我面临的情况是 x 向量可能只有 5~9 维,而我需要 y 是一个多项分布向量,最多可以有 800 维。这使问题变得非常棘手。

我研究了多任务机器学习方法中的很多东西,我可以同时训练所有这些 y_i。当然,另一种愚蠢的方式是我也可以单独训练所有这些维度,而不考虑任务之间的联系。但问题是,在查看了很多论文之后,似乎大多数 MTL 实验只处理 10~30 个任务,这意味着 800 个任务可能很疯狂而且很难训练。也许集群可能是一个解决方案,但我真的很好奇任何人都可以就其他方法来处理这个问题提出一些建议,而不是从 MTL 的角度来看。

4

1 回答 1

0

当输入如此“小”而输出如此之大时,我希望这些输出值会有不同的表示。您可以分析它们是某种线性组合还是非线性组合,以便估计“函数参数”而不是值本身。示例:我们曾经估计过一个时间序列,它可以“简化”为正态分布的加权和,所以我们只需要估计权重和参数。

最后,当您只有 6 个输入参数时,您将在某种意义上(可能不是线性的)仅到达 6 到 12 维的子空间。它们当然可能有点复杂,但为了避免 800 暗空间中的混乱,我真的会考虑对结果进行参数化。

正如我所评论的,我知道机器学习会产生向量。http://en.wikipedia.org/wiki/Bayes_estimator

于 2013-05-31T22:13:47.690 回答