5

我是 vowpal wabbit 的新手,所以对此有一些疑问。

我将数据集传递给大众并拟合模型并获得样本内预测,并使用 -f 保存模型。到目前为止,一切都很好。我知道如何使用模型并对不同的数据集进行预测。但我想知道如何为模型添加更多观察并更新它。

主要目标:使用一些数据首先让 vw 在线学习它,然后使用该模型来预测一些数据。然后使用新数据更新模型。然后使用更新的数据来预测另一个新的观察结果,这个过程应该继续下去。

正如我所说,我是新手,所以请尽量原谅这个问题的琐碎性

4

1 回答 1

7
vw -i existing.model -f new.model more_observations.dat

助记符:

  • -i最初的
  • -f最后

您甚至可以使用相同的模型文件名-i并“就地-f”更新,因为它并不是真正的就地。模型替换以原子方式在运行结束时发生(将临时文件重命名为最终文件),如以下输出所示(添加了注释):strace

$ strace -e open,close,rename vw --quiet -i zz.model -f zz.model f20-315.tt.gz
# loading the initial (-i zz.model) model into memory
open("zz.model", O_RDONLY)              = 3
# done loading, so we can close it
close(3)                                = 0
# Now reading the data-set and learning in memory
open("f20-315.tt.gz", O_RDONLY)         = 3
# data read complete. write the updated model into a temporary file
open("zz.model.writing", O_WRONLY|O_CREAT|O_TRUNC, 0666) = 4
close(4)                                = 0
# and rename atomically to the final (-f zz.model) model file 
rename("zz.model.writing", "zz.model")  = 0
...
close(4)                                = 0
close(3)                                = 0
+++ exited with 0 +++
于 2015-07-09T17:13:53.497 回答