问题标签 [vowpalwabbit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vowpalwabbit - 如何在 vowpal wabbit 中为 SVM 返回 [0, 1] 区间内的预测
抱歉,如果这已经被问过了。而不是原始预测 ( -r
),我想通过设置为在 vowpal wabbit 中训练的 SVM 返回 [0, 1] 区间内的预测-loss_function hinge
。目前我正在尝试这个,但它没有给我我想要的东西。有什么想法吗?
干杯
亚伦
编辑:
1)样本数据:
2)我目前得到的:
3)我想看到的:在连续 [0, 1] 区间中的预测,这样每个条目都可以解释为与事件相关的预测概率,例如:
machine-learning - 使用 Vowpal Webbit 基于大文本的预测
我想使用以分钟为单位的解决时间和 Zendesk 上工单的客户描述来根据他们的描述预测下一个工单的解决时间。我将只使用这两个值,但描述是一个大文本。我在 Vowpal Wabbit 上搜索了对特征值进行哈希处理而不是对特征名称进行哈希处理,但没有成功。使用 Vowpal 预测大文本特征值的更好方法是什么?
vowpalwabbit - 如何使用 vowpal wabbit 进行在线预测(流模式)
我正在尝试将 Vowpal Wabbit 用于具有 154 个不同类别标签的多类别分类任务,如下所示:
- 经过大量数据训练的 VW 模型。
- 使用一个专用测试集测试模型。
在这种情况下,我能够达到 >80% 的结果,这很好。但目前我正在处理的问题是:
我必须复制实时预测场景。在这种情况下,我必须一次传递一个数据点(即文本行),以便模型可以预测值和输出。
我已经尝试了所有我知道但失败的选项。你们中的任何人都可以让我知道如何通过将一个数据点与大众命令一起传递而不是作为文件传递来创建实时场景。
machine-learning - bagging/boosting 使用元音 wabbit
我如何在带有 SVM 的 vowpal wabbit 中使用 bagging 或 boosting。
我目前的结果是 90% 的召回率和 10% 的准确率。
我想使用 bagging/boosting 来提高精度
vowpalwabbit - Vowpal Wabbit:在 --daemon 模式下获取 readable_model
我正在尝试以 --daemon 模式将我的数据流式传输到 vw,并希望在最后获得每个变量的系数值。因此,我希望 vw 在 --daemon 模式下: - 将我发送的每一行数据的系数的当前值发回给我。- 以“--readable_model”格式写入生成的模型。
我知道save_namemodel | ...
在守护程序模式下获取 vw 以将模型保存到给定文件的虚拟示例技巧,但这还不够,因为我无法访问该文件中的系数值。
关于如何解决我的问题的任何想法?
vowpalwabbit - Vowpal Wabbit 可读模型没有权重
我想用 Vowpal Wabbit 做套索回归。所以,我使用了这个命令行
可读文件没有显示我使用的功能的权重。但是当我跳过参数--l1 时,它会正确显示权重。另外,当我不提供--l1 参数时,它会得出这样的权重..
- 1:-0.437898 994842.000000 1.000000
- 33340:-0.176359 201942.265625 1.006310
- 59044:-0.152967 201843.875000 1.002754
- 63438:-0.187405 202149.140625 1.015530
- 124204:-0.159398 201741.187500 1.002742
- 166130:-0.185312 201754.421875 1.013330
这表明所有的权重都是负的。但是我的所有功能都受到了 +ve 的重视。因此,对于所有观察结果,我的特征线性组合对所有观察结果都为负值 -ve。但我将 +ve 和 -ve 都视为预测标签。
三个问题
- 我的命令行对于套索回归是否正确。
- 什么能让我看到重量。
- 是什么让我看不懂全负重事件
vowpalwabbit - 如何让 vowpal wabbit 使用更多的观察
我是 vowpal wabbit 的新手,所以对此有一些疑问。
我将数据集传递给大众并拟合模型并获得样本内预测,并使用 -f 保存模型。到目前为止,一切都很好。我知道如何使用模型并对不同的数据集进行预测。但我想知道如何为模型添加更多观察并更新它。
主要目标:使用一些数据首先让 vw 在线学习它,然后使用该模型来预测一些数据。然后使用新数据更新模型。然后使用更新的数据来预测另一个新的观察结果,这个过程应该继续下去。
正如我所说,我是新手,所以请尽量原谅这个问题的琐碎性
vowpalwabbit - 如何将 Vowpal Wabbit 逻辑预测转换为概率
我给了 vowpal wabbit 一个带有两个标签的数据集,并用它进行了逻辑回归。问题是,它返回从正到负变化的实数作为预测。现在,如果我想将这些值转换为某种概率。我该怎么办。
我在想也许预测值是 a'x ,其中 a 是系数向量,x 是特征向量。如果是这种情况,那么我可以直接使用二项式链接函数来获取概率。
lda - 如何从 vowpall_wabbit 为 LDA 中的每个主题生成最有价值的词?
我有一个由 vowpal wabbit 构建的 LDA 模型。在教程中,我看到可以像这样为每个主题打印最有价值的词
当我只有模型文件时,有谁知道如何产生这样的输出?
machine-learning - 停止机器学习训练,但使用 Vowpal Wabbit 保持模型的当前状态
我目前正在使用 vowpal wabbit 进行培训阶段。数据集很大(4GBytes),已经运行了一整夜。还在训练中,不知道能坚持多少天。
您是否知道是否有办法停止训练,但将模型保持并保存在当前状态,因此必须在真实数据上对其进行测试?