我正在用来自两个不同来源的数据流训练一个神经网络,启发式地:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --oaa 10 --nn 20 --save_resume -i /tmp/weights -f /tmp/weights
但是,这会引发一个错误,即“--oaa 不能多次传递”。很好,--save_resume
坚持配置参数,所以我修改了:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --save_resume -i /tmp/weights -f /tmp/weights
一切正常。出于好奇,我在没有--save_resume
选项的情况下重复了第二种方法,一切仍然有效,只是模型性能稍差一些。
我推测这会--save_resume
保存在权重文件中看到的学习率和示例数量。这似乎是从输出中发生的事情,并证实了更好的性能。还有别的事吗?
编辑:经过一些实验,我发现通过初始回归-i
量是引发“选项'--oaa'不能指定多次错误”的原因,而不是--save_resume
.