0

我正在尝试在一组文件上运行 vowpal wabbit(截至目前大约 10 个)。我的实验如下:

  1. 将第一个火车文件转换为大众格式

  2. 使用第一个训练文件训练 VW 模型并存储模型。

  3. 使用存储的模型验证测试文件的准确性

  4. 现在将第二个文件转换为 VW 格式并使用第二个文件重新训练步骤 2 中存储的模型并存储更新的模型

  5. 在重新训练的模型上验证测试文件并报告准确性。

  6. 使用 for 循环对剩余的文件集重复步骤 4-5(每次迭代中的测试文件都相同)

当我做这个实验时,我遇到了一些错误。在这里,我正在粘贴训练、重新训练和验证命令以及错误。

你们中的任何人都可以帮助我重现这种情况而不会出现任何错误。

命令:

这里 'i' 的范围是 1 到 10

$idec = i -1(以前模型的索引)

vw -d ${i}_processed_binary_compressed.vw --loss_function 逻辑 -i ${idec}_processed_binary_compressed.model.vw --quiet --save_resume -f ${i}_processed_binary_compressed.model.vw

echo echo "day_$i 完成模型训练"

echo "${i}_day 模型验证正在进行中..." echo

vw 10_processed_binary_compressed_test.vw -t -i ${i}_processed_binary_compressed.model.vw --quiet --hash strings -p 10_processed_binary_compressed_test_${i}_day_result.csv -r 10_processed_binary_compressed_test_${i}_day_raw.txt

错误:

vw:不能多次指定选项“--data”

4

1 回答 1

0

我无法复制问题(但 TOC_cmi 要求粘贴我使用的 commonads):

git clone https://github.com/JohnLangford/vowpal_wabbit.git
cd vowpal_wabbit
make
cd test/train-sets

vw -d rcv1_smaller.dat --loss_function=logistic --save_resume -f day1.model
vw -d rcv1_small.dat --loss_function=logistic --save_resume -i day1.model -f day2.model
vw -t -d rcv1_smaller.dat --loss_function=logistic -i day2.model -p day2.predictions -r day2.raw
于 2014-12-01T14:19:31.127 回答