问题标签 [vowpalwabbit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vowpalwabbit - Vowpal Wabbit varinfo 和 ngrams:不存在的组合
我正在尝试使用 vw 来查找预测某人是否会打开电子邮件的单词或短语。如果他们打开电子邮件,则目标为 1,否则为 0。我的数据如下所示:
我将它放入一个名为“test1.txt”的文件中并运行以下代码来执行 2 的 ngrams 并输出变量信息:
当我查看输出时,有一些我在原始数据中看不到的二元组。这是一个错误还是我误解了什么。
输出:
例如,^bought^great
从未实际出现在任何原始输入行中。难道我做错了什么?
java - Vowpal Wabbit 在不写入磁盘的情况下执行
我编写了一个 java 代码以通过以下方式执行 Vowpal Wabbit:
命令在哪里
vw -d input.txt --loss_function=logistic -f model.vw
这样做的缺点是它需要写入磁盘。经过一番搜索,我了解到 vowpal wabbit 支持从 R 中的标准输入示例中读取数据
我在 Java 1.8 中找不到任何示例来完成此操作。有人可以和我分享一个吗?
vowpalwabbit - 解读 Vowpal Wabbit 结果:为什么有些行会附加“h”?
以下是训练我的大众模型的部分日志。
为什么有些行后面跟着 h?您会注意到最后总结中的“平均损失”行也是如此。我不确定这意味着什么,或者我是否应该关心。
谢谢
probability - 数据集移位适应和 Vowpal Wabbit
我目前正在玩 Vowpal Wabbit。我对该工具如何处理数据集变化特别感兴趣。从我的直觉来看,这应该是直截了当的,因为 VW 是一种在线算法。因此,我生成了一个具有三个特征的测试数据集。以下字典包含特征的名称和正面或负面的概率:
然后我通过以下方式生成一个玩具数据集:
- 均匀随机选择一个特征
- 生成具有相应概率的类标签 1,否则生成 -1
- 生成大约 100000 个数据集/行
我使用 Vowpal Wabbit 在此数据集上学习,使用如下命令:
我的 logloss 和 auc 看起来像这样:
已学习的概率如下所示:
结果相当准确。现在我创建另一个具有以下概率的数据集:
因此,属于特定类别的特征的概率发生了变化,这本质上是数据集的转移。因为这对我很感兴趣,所以我现在特意包含旧模型来学习新数据集。那是:
但是,我现在没有看到某种适应,而是得到以下结果:
并且特征的概率在第二次运行后不会改变:
所以我的结论是:当在第二个数据集学习中包含旧模型时,什么都学不到。但是,我预计 Vowpal Wabbit 会在一段时间后适应这种转变。显然,这不会发生。
我的问题:如何调整 vowpal wabbit 参数以适应这样的数据集转换?
machine-learning - Vowpal Wabbit Logistic 回归
我正在使用 Vowpal Wabbit 对具有 25 个特征和 4800 万个实例的数据集执行逻辑回归。我对当前预测值有疑问。它应该在 0 或 1 之内。
machine-learning - Vowpal Wabbit 训练和测试数据格式
我正在尝试 Vowpal Wabbit,并且正在确定培训和测试所需的文件格式。我一直在关注https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial的教程,看到以下是训练数据格式:
对于测试数据,我没有标签或任何输出,只有特征。我将如何写出来?我试过只包括这样的功能:
但是,这给了我例外,因为它不是正确的格式。我还尝试了以下方法,结果都只给了我 0:
任何我应该瞄准的格式,只知道功能?谢谢您的帮助。
c++ - 安装 vowpal wabbit/访问 boost 程序选项时遇到问题
我正在尝试在运行 Yosemite OSX 的 Mac Mini 2012 上安装 vowpal wabbit。
正如 John Langford 建议的那样,我无法锻炼如何直接从源代码伪造安装 boost:https ://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial 。相反,我选择了以下sudo port install boost
. 这似乎工作正常,我已经验证该文件program_options.hpp
存在于 location 中/opt/local/include/boost/program_options.hpp
。
然后我克隆 vowpal_wabbit
到我的根目录并尝试使用sudo make install
. 当我这样做时,我的终端出现以下错误,说program_options.hpp
找不到:
我在错误的地方安装了boost吗?有没有我错过的步骤?有什么方法可以告诉 vowpal wabbit 在哪里安装?
提前致谢,
亚伦
vowpalwabbit - 如何为 vowpal wabbit 中的文件序列重新训练模型
我正在尝试在一组文件上运行 vowpal wabbit(截至目前大约 10 个)。我的实验如下:
将第一个火车文件转换为大众格式
使用第一个训练文件训练 VW 模型并存储模型。
使用存储的模型验证测试文件的准确性
现在将第二个文件转换为 VW 格式并使用第二个文件重新训练步骤 2 中存储的模型并存储更新的模型
在重新训练的模型上验证测试文件并报告准确性。
使用 for 循环对剩余的文件集重复步骤 4-5(每次迭代中的测试文件都相同)
当我做这个实验时,我遇到了一些错误。在这里,我正在粘贴训练、重新训练和验证命令以及错误。
你们中的任何人都可以帮助我重现这种情况而不会出现任何错误。
命令:
这里 'i' 的范围是 1 到 10
$idec = i -1(以前模型的索引)
vw -d ${i}_processed_binary_compressed.vw --loss_function 逻辑 -i ${idec}_processed_binary_compressed.model.vw --quiet --save_resume -f ${i}_processed_binary_compressed.model.vw
echo echo "day_$i 完成模型训练"
echo "${i}_day 模型验证正在进行中..." echo
vw 10_processed_binary_compressed_test.vw -t -i ${i}_processed_binary_compressed.model.vw --quiet --hash strings -p 10_processed_binary_compressed_test_${i}_day_result.csv -r 10_processed_binary_compressed_test_${i}_day_raw.txt
错误:
vw:不能多次指定选项“--data”
feature-selection - Vowpal Wabbit 忽略线性项,只保留交互项
您好有一个带有两个命名空间的 Vowpal Wabbit 文件,例如:
使用 -q AB,我可以获得交互项。有什么办法让我只保留交互项而忽略线性项?
换句话说,vw sample.vw -q AB --invert_hash sample.model
现在的结果是这样的:
我希望它是这样的:
--keep 和 --ignore 选项不会产生预期的效果,因为它们似乎是在生成二次项之前考虑的。是否可以使用 vw 执行此操作,或者我是否需要创建所有组合的自定义预处理步骤?
vowpalwabbit - vowpal wabbit 安装制作文件
我很难安装 vowpal wabbit。
我遇到的问题是在克隆 vw 之后,当我运行命令 make 时。下面的错误信息
非常感谢任何帮助!操作系统:Windows 8.1 64 位 谢谢
一个