问题标签 [vowpalwabbit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1774 浏览

machine-learning - Vowpal Wabbit 的梯度提升

有没有办法使用 Vowpal Wabbit 对回归使用梯度提升?我使用 Vowpal Wabbit 附带的各种有用的技术。我想尝试梯度提升,但我找不到在大众汽车上实现梯度提升的方法。

0 投票
1 回答
555 浏览

variables - Vowpal Wabbit - 使用选项 --keep 指定命名空间的全名

我必须以下情况:我想在调用 Vowpal Wabbit 在数据集上训练它时保留特定的命名空间。

--keep”选项将命名空间的第一个字母作为参数。但是,如果两个命名空间以相同的字母开头,而我只想保留其中一个呢?

1.00 |A1 变量 1 变量 2 |A2 变量 3 变量 4

vw train_data.vw --keep "A1" ==>不可能,因为 keep 只需要一个字符

一个“肮脏”的解决方案是重命名每个命名空间,以便它们都以不同的字母开头,但这对我来说是不可能的,因为我需要为每个变量创建一个命名空间,而且变量中的变量比字母多得多字母...

关于如何解决这个问题的任何看法?

0 投票
1 回答
43 浏览

vowpalwabbit - 将数据集输入到 Vowpalwabbit

如果我的桌面上有 tsv 格式的数据集,我如何将它作为输入输入到 vowpal 我试过 vw -d/Desktop/Boston.tsv 它无法读取文件。我是 vowpal 和 shell 脚本的新手。请在这件事上给予我帮助

0 投票
1 回答
124 浏览

machine-learning - 机器学习 - 一次预测一个实例 - 大量实例 - 尽量不使用 I/O

我有一个大数据集,我正在尝试为它构建一个 DAgger 分类器。如您所知,在训练时,我需要在训练实例上运行初始学习分类器(预测它们),一次一个实例。

即使是最初的学习,Libsvm 也太慢了。

我正在使用 OLL,但这需要将每个实例写入一个文件,然后在其上运行测试代码并获得预测,这涉及许多磁盘 I/O。

我考虑过使用 vowpal_wabbit(但我不确定它是否有助于磁盘 I/O),但我没有权限将它安装在我正在使用的集群上。

Liblinear 太慢了,相信又需要磁盘 I/OI。我可以使用哪些其他替代方案?

0 投票
1 回答
787 浏览

vowpalwabbit - 使用 Vowpal wabbit 的上下文强盗

在这种情况下,输入之一是选择手臂/动作的概率,但我们如何找到该概率?找到这个概率本身不是一项艰巨的任务吗?

0 投票
1 回答
458 浏览

python - 在 vowpal 上计算分数

我正在尝试对 vowpal 中的样本数据运行逻辑回归。我创建了一个示例数据集,如下所示:

当我尝试运行逻辑时,它显示错误“您使用的是损失函数专家或格式错误示例指定的标签 0 而不是 -1 或 1”

在此之后,我想计算最后的分数以及如何在 vowpal 中计算分数或 auc 曲线

0 投票
1 回答
170 浏览

bash - 在 bash 脚本中使用 expr 时发生 hadoop 流错误

我正在使用 Hadoop 流式处理工作。

我的映射器是用 bash 编写的。它使用job_id。

它工作正常(为调试目的启动一个愚蠢的 wordcound 映射器操作),直到我有以下行使工作崩溃:

错误是:

等等

知道为什么它不起作用吗?直接在命令行就可以了。我还尝试使用另一个名为 dummy 的变量。同样的错误。

注意:这一行是因为映射器中稍后应该有另一个作业需要获取 id 并且不能与先前作业的 id 冲突。我正在尝试获得适用于 allreduce 的 vowpal wabbit 集群实现。

0 投票
2 回答
992 浏览

machine-learning - Vowpal Wabbit - 精确召回 f 测量

您通常如何从 Vowpal Wabbit 中针对分类问题创建的模型中获得准确率、召回率和 f 度量?

是否有任何可用的脚本或程序通常用于大众的输出?

使用 playtennis.txt 中的以下数据做一个最小的例子:

我使用以下方法创建模型:

然后,我通过以下方式获得训练模型对训练数据本身的预测和原始预测:

从这里开始,在给定训练数据playtennis.txt和对训练数据的预测的情况下,您通常使用哪些脚本或程序来获得精度、召回率和 f 测量playtennis.predict

此外,如果这是一个多标签分类问题(每个实例可以有多个目标标签,vw 也可以处理),您提出的脚本或程序是否能够处理这些问题?

0 投票
0 回答
99 浏览

bash - Update 'vw' command line call to reference most current vowpal_wabbit installation

I recently updated my installation of vowpal wabbit by manually deleting the vowpal_wabbit directory and reinstalling according to the instructions at https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial.

I needed access to the --link=logistic option, which my older installation didn't have. Currently the command:

gives me what I want, whereas

hangs. It seems that only by explicitly declaring the path to the most current implementation of vw am I able to get the result I'm looking for.

This is probably more of a Unix/BASH question, but how do I update the short call to vw? I've had similar difficulties using vw-varinfo for what I suspect are similar reasons.

0 投票
4 回答
459 浏览

machine-learning - How do I get the raw predictions (-r) from Vowpal Wabbit when running in daemon mode?

Using the below, I'm able to get both the raw predictions and the final predictions as a file:

However, I'm unable to get the raw predictions when I run VW as a daemon:

Do I have a pass in a specific argument or parameter to get the raw predictions? I prefer the raw predictions, not the final predictions. Thanks