5

我正在使用HCRF 库进行序列预测任务。为了学习模型参数,我使用的是 LBFGS,尽管有使用 CG 和 BFGS 的选项。

我注意到收敛需要很长时间。我已将最大迭代次数(当前)设置为 5000。如果我对 HCRF 库的解释是正确的,那么从迭代到迭代的估计变化确实会变小。但是,该程序似乎不太可能在少于 5000 次迭代后终止,而且它确实需要这么长时间。

如果我将最大迭代次数设置为 500,那么在第 500 次迭代时,结果如下所示:

Iteration 500
fx = 465.359
xnorm 38.0831, gnorm = 46.3165, step = 1line search = 1

它以以下消息终止:

L-BFGS optimization terminated with status code = -997
fx = 465.359

这意味着已经达到最大迭代次数。

这对数据意味着什么?是否可以在更早的时间终止它(例如 300 次迭代)?如果是这样,合理的“上限”或最大迭代次数是多少?

为了让您了解我正在训练的数据,我使用了 20,000 - 30,000 个观察值,每个观察值有 14 个特征。

谢谢,任何见解都将不胜感激。

4

0 回答 0