问题标签 [vowpalwabbit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - Vowpal Wabbit 的梯度提升
有没有办法使用 Vowpal Wabbit 对回归使用梯度提升?我使用 Vowpal Wabbit 附带的各种有用的技术。我想尝试梯度提升,但我找不到在大众汽车上实现梯度提升的方法。
variables - Vowpal Wabbit - 使用选项 --keep 指定命名空间的全名
我必须以下情况:我想在调用 Vowpal Wabbit 在数据集上训练它时保留特定的命名空间。
“ --keep”选项将命名空间的第一个字母作为参数。但是,如果两个命名空间以相同的字母开头,而我只想保留其中一个呢?
1.00 |A1 变量 1 变量 2 |A2 变量 3 变量 4
vw train_data.vw --keep "A1" ==>不可能,因为 keep 只需要一个字符
一个“肮脏”的解决方案是重命名每个命名空间,以便它们都以不同的字母开头,但这对我来说是不可能的,因为我需要为每个变量创建一个命名空间,而且变量中的变量比字母多得多字母...
关于如何解决这个问题的任何看法?
vowpalwabbit - 将数据集输入到 Vowpalwabbit
如果我的桌面上有 tsv 格式的数据集,我如何将它作为输入输入到 vowpal 我试过 vw -d/Desktop/Boston.tsv 它无法读取文件。我是 vowpal 和 shell 脚本的新手。请在这件事上给予我帮助
machine-learning - 机器学习 - 一次预测一个实例 - 大量实例 - 尽量不使用 I/O
我有一个大数据集,我正在尝试为它构建一个 DAgger 分类器。如您所知,在训练时,我需要在训练实例上运行初始学习分类器(预测它们),一次一个实例。
即使是最初的学习,Libsvm 也太慢了。
我正在使用 OLL,但这需要将每个实例写入一个文件,然后在其上运行测试代码并获得预测,这涉及许多磁盘 I/O。
我考虑过使用 vowpal_wabbit(但我不确定它是否有助于磁盘 I/O),但我没有权限将它安装在我正在使用的集群上。
Liblinear 太慢了,相信又需要磁盘 I/OI。我可以使用哪些其他替代方案?
vowpalwabbit - 使用 Vowpal wabbit 的上下文强盗
在这种情况下,输入之一是选择手臂/动作的概率,但我们如何找到该概率?找到这个概率本身不是一项艰巨的任务吗?
python - 在 vowpal 上计算分数
我正在尝试对 vowpal 中的样本数据运行逻辑回归。我创建了一个示例数据集,如下所示:
当我尝试运行逻辑时,它显示错误“您使用的是损失函数专家或格式错误示例指定的标签 0 而不是 -1 或 1”
在此之后,我想计算最后的分数以及如何在 vowpal 中计算分数或 auc 曲线
bash - 在 bash 脚本中使用 expr 时发生 hadoop 流错误
我正在使用 Hadoop 流式处理工作。
我的映射器是用 bash 编写的。它使用job_id。
它工作正常(为调试目的启动一个愚蠢的 wordcound 映射器操作),直到我有以下行使工作崩溃:
错误是:
等等
知道为什么它不起作用吗?直接在命令行就可以了。我还尝试使用另一个名为 dummy 的变量。同样的错误。
注意:这一行是因为映射器中稍后应该有另一个作业需要获取 id 并且不能与先前作业的 id 冲突。我正在尝试获得适用于 allreduce 的 vowpal wabbit 集群实现。
machine-learning - Vowpal Wabbit - 精确召回 f 测量
您通常如何从 Vowpal Wabbit 中针对分类问题创建的模型中获得准确率、召回率和 f 度量?
是否有任何可用的脚本或程序通常用于大众的输出?
使用 playtennis.txt 中的以下数据做一个最小的例子:
我使用以下方法创建模型:
然后,我通过以下方式获得训练模型对训练数据本身的预测和原始预测:
从这里开始,在给定训练数据playtennis.txt
和对训练数据的预测的情况下,您通常使用哪些脚本或程序来获得精度、召回率和 f 测量playtennis.predict
?
此外,如果这是一个多标签分类问题(每个实例可以有多个目标标签,vw 也可以处理),您提出的脚本或程序是否能够处理这些问题?
bash - Update 'vw' command line call to reference most current vowpal_wabbit installation
I recently updated my installation of vowpal wabbit by manually deleting the vowpal_wabbit directory and reinstalling according to the instructions at https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial.
I needed access to the --link=logistic
option, which my older installation didn't have. Currently the command:
gives me what I want, whereas
hangs. It seems that only by explicitly declaring the path to the most current implementation of vw
am I able to get the result I'm looking for.
This is probably more of a Unix/BASH question, but how do I update the short call to vw
? I've had similar difficulties using vw-varinfo for what I suspect are similar reasons.
machine-learning - How do I get the raw predictions (-r) from Vowpal Wabbit when running in daemon mode?
Using the below, I'm able to get both the raw predictions and the final predictions as a file:
However, I'm unable to get the raw predictions when I run VW as a daemon:
Do I have a pass in a specific argument or parameter to get the raw predictions? I prefer the raw predictions, not the final predictions. Thanks