问题标签 [vowpalwabbit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
759 浏览

vowpalwabbit - Vowpal Wabbit varinfo 和 ngrams:不存在的组合

我正在尝试使用 vw 来查找预测某人是否会打开电子邮件的单词或短语。如果他们打开电子邮件,则目标为 1,否则为 0。我的数据如下所示:

我将它放入一个名为“test1.txt”的文件中并运行以下代码来执行 2 的 ngrams 并输出变量信息:

当我查看输出时,有一些我在原始数据中看不到的二元组。这是一个错误还是我误解了什么。

输出:

例如,^bought^great从未实际出现在任何原始输入行中。难道我做错了什么?

0 投票
1 回答
691 浏览

java - Vowpal Wabbit 在不写入磁盘的情况下执行

我编写了一个 java 代码以通过以下方式执行 Vowpal Wabbit:

命令在哪里

vw -d input.txt --loss_function=logistic -f model.vw

这样做的缺点是它需要写入磁盘。经过一番搜索,我了解到 vowpal wabbit 支持从 R 中的标准输入示例中读取数据

我在 Java 1.8 中找不到任何示例来完成此操作。有人可以和我分享一个吗?

0 投票
2 回答
1082 浏览

vowpalwabbit - 解读 Vowpal Wabbit 结果:为什么有些行会附加“h”?

以下是训练我的大众模型的部分日志。

为什么有些行后面跟着 h?您会注意到最后总结中的“平均损失”行也是如此。我不确定这意味着什么,或者我是否应该关心。

谢谢

0 投票
0 回答
175 浏览

probability - 数据集移位适应和 Vowpal Wabbit

我目前正在玩 Vowpal Wabbit。我对该工具如何处理数据集变化特别感兴趣。从我的直觉来看,这应该是直截了当的,因为 VW 是一种在线算法。因此,我生成了一个具有三个特征的测试数据集。以下字典包含特征的名称和正面或负面的概率:

然后我通过以下方式生成一个玩具数据集:

  1. 均匀随机选择一个特征
  2. 生成具有相应概率的类标签 1,否则生成 -1
  3. 生成大约 100000 个数据集/行

我使用 Vowpal Wabbit 在此数据集上学习,使用如下命令:

我的 logloss 和 auc 看起来像这样:

已学习的概率如下所示:

结果相当准确。现在我创建另一个具有以下概率的数据集:

因此,属于特定类别的特征的概率发生了变化,这本质上是数据集的转移。因为这对我很感兴趣,所以我现在特意包含旧模型来学习新数据集。那是:

但是,我现在没有看到某种适应,而是得到以下结果:

并且特征的概率在第二次运行后不会改变:

所以我的结论是:当在第二个数据集学习中包含旧模型时,什么都学不到。但是,我预计 Vowpal Wabbit 会在一段时间后适应这种转变。显然,这不会发生。

我的问题:如何调整 vowpal wabbit 参数以适应这样的数据集转换?

0 投票
1 回答
1112 浏览

machine-learning - Vowpal Wabbit Logistic 回归

我正在使用 Vowpal Wabbit 对具有 25 个特征和 4800 万个实例的数据集执行逻辑回归。我对当前预测值有疑问。它应该在 0 或 1 之内。

0 投票
1 回答
2524 浏览

machine-learning - Vowpal Wabbit 训练和测试数据格式

我正在尝试 Vowpal Wabbit,并且正在确定培训和测试所需的文件格式。我一直在关注https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial的教程,看到以下是训练数据格式:

对于测试数据,我没有标签或任何输出,只有特征。我将如何写出来?我试过只包括这样的功能:

但是,这给了我例外,因为它不是正确的格式。我还尝试了以下方法,结果都只给了我 0:

任何我应该瞄准的格式,只知道功能?谢谢您的帮助。

0 投票
2 回答
799 浏览

c++ - 安装 vowpal wabbit/访问 boost 程序选项时遇到问题

我正在尝试在运行 Yosemite OSX 的 Mac Mini 2012 上安装 vowpal wabbit。

正如 John Langford 建议的那样,我无法锻炼如何直接从源代码伪造安装 boost:https ://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial 。相反,我选择了以下sudo port install boost. 这似乎工作正常,我已经验证该文件program_options.hpp存在于 location 中/opt/local/include/boost/program_options.hpp

然后我克隆 vowpal_wabbit到我的根目录并尝试使用sudo make install. 当我这样做时,我的终端出现以下错误,说program_options.hpp找不到:

在此处输入图像描述

我在错误的地方安装了boost吗?有没有我错过的步骤?有什么方法可以告诉 vowpal wabbit 在哪里安装?

提前致谢,

亚伦

0 投票
1 回答
738 浏览

vowpalwabbit - 如何为 vowpal wabbit 中的文件序列重新训练模型

我正在尝试在一组文件上运行 vowpal wabbit(截至目前大约 10 个)。我的实验如下:

  1. 将第一个火车文件转换为大众格式

  2. 使用第一个训练文件训练 VW 模型并存储模型。

  3. 使用存储的模型验证测试文件的准确性

  4. 现在将第二个文件转换为 VW 格式并使用第二个文件重新训练步骤 2 中存储的模型并存储更新的模型

  5. 在重新训练的模型上验证测试文件并报告准确性。

  6. 使用 for 循环对剩余的文件集重复步骤 4-5(每次迭代中的测试文件都相同)

当我做这个实验时,我遇到了一些错误。在这里,我正在粘贴训练、重新训练和验证命令以及错误。

你们中的任何人都可以帮助我重现这种情况而不会出现任何错误。

命令:

这里 'i' 的范围是 1 到 10

$idec = i -1(以前模型的索引)

vw -d ${i}_processed_binary_compressed.vw --loss_function 逻辑 -i ${idec}_processed_binary_compressed.model.vw --quiet --save_resume -f ${i}_processed_binary_compressed.model.vw

echo echo "day_$i 完成模型训练"

echo "${i}_day 模型验证正在进行中..." echo

vw 10_processed_binary_compressed_test.vw -t -i ${i}_processed_binary_compressed.model.vw --quiet --hash strings -p 10_processed_binary_compressed_test_${i}_day_result.csv -r 10_processed_binary_compressed_test_${i}_day_raw.txt

错误:

vw:不能多次指定选项“--data”

0 投票
1 回答
419 浏览

feature-selection - Vowpal Wabbit 忽略线性项,只保留交互项

您好有一个带有两个命名空间的 Vowpal Wabbit 文件,例如:

使用 -q AB,我可以获得交互项。有什么办法让我只保留交互项而忽略线性项?

换句话说,vw sample.vw -q AB --invert_hash sample.model现在的结果是这样的:

我希望它是这样的:

--keep 和 --ignore 选项不会产生预期的效果,因为它们似乎是在生成二次项之前考虑的。是否可以使用 vw 执行此操作,或者我是否需要创建所有组合的自定义预处理步骤?

0 投票
1 回答
785 浏览

vowpalwabbit - vowpal wabbit 安装制作文件

我很难安装 vowpal wabbit。

我遇到的问题是在克隆 vw 之后,当我运行命令 make 时。下面的错误信息

非常感谢任何帮助!操作系统:Windows 8.1 64 位 谢谢

一个