我有 3 参数估计问题(所以维度很低,内存不是问题),其中目标函数和梯度 + hessians 的评估速度很慢,因为它是蒙特卡洛模拟的结果。但是,我的代码已实现,因此我可以使用自动微分获得梯度 + hessian,这应该比基于有限差分的近似更好。
因此,我想做尽可能少的迭代,也就是。函数和梯度/粗麻布评估尽可能达到最佳。那么 Newton-Raphson 方法会成为使用 AD 生成粗麻布的方法吗?
我有 3 参数估计问题(所以维度很低,内存不是问题),其中目标函数和梯度 + hessians 的评估速度很慢,因为它是蒙特卡洛模拟的结果。但是,我的代码已实现,因此我可以使用自动微分获得梯度 + hessian,这应该比基于有限差分的近似更好。
因此,我想做尽可能少的迭代,也就是。函数和梯度/粗麻布评估尽可能达到最佳。那么 Newton-Raphson 方法会成为使用 AD 生成粗麻布的方法吗?