我有一个非常复杂的模型,其中包含许多需要解决的参数。尽管模型很复杂,但每一步的函数形式并不是不规则的。
我看到一些带有起始值的奇怪行为。如果我从标准的随机值(全为 0)开始,求解器会在 673 秒内以“找到局部最优解”、0 次 CG 迭代收敛。
如果我从我知道的接近解的值开始,求解器会在 1718 秒内收敛于“无法改进原始可行解估计。”,493 次 CG 迭代。
请注意,在这两种情况下,最终值都相同(或非常相似)。
2个问题:
- 共轭梯度迭代的次数究竟是多少,例如求解器何时需要计算共轭梯度?在 1 种情况下,我看到 0 次 CG 迭代,在另一种情况下,我看到 493 次 CG 迭代。这意味着什么?(请注意,我确实知道 CG 方法是什么,只是不确定为什么在一种情况下与 0 存在巨大差异。)
- “更好的”初始值会显着减慢优化收敛的所有可能解释是什么?