在度量学习的训练过程中,如果代价函数是凸的,那么我可以使用梯度下降法,得到最优解。
现在,我想从一个训练集中训练 N(N 可能非常大,比如 100) 个度量,一种方法是调整成本函数,使这些 N 个度量组合成一个大度量矩阵,并使用梯度下降法, 但是,如果 N 很大,这种方法不是很好,在这种情况下,有没有我可以使用的“替代优化”方法?,我可以固定 2th~Nth 指标并只进行梯度下降第 1 个度量,然后固定第 1、3~N 个度量,并仅对第 2 个度量进行梯度下降。这种“替代优化”方法是否存在一些必要条件