我正在查看以下 2 个关于使用 --adaptive 标志时 VW 所做更新的演示文稿。好像这些都不一样。
- http://www.slideshare.net/jakehofman/technical-tricks-of-vowpal-wabbit
- https://github.com/JohnLangford/vowpal_wabbit/wiki/v6.1_tutorial.pdf
使用这两个描述(分别):
#1
#2
我的问题:
哪些是正确的(或者它们是相同的)?
对于数字 1,分母中似乎使用了 t+1 示例中的梯度。这是怎么做到的?这是否意味着新的权重(标记为 w_i)是例如 t+1 的权重?