问题标签 [vowpalwabbit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
598 浏览

php - 从 Vowpal Wabbit 守护程序模式获取结果

我在守护程序模式下运行 VW。作为一个独立的可执行文件,它运行得非常好。在守护程序模式下,我最初会看到一些关于预测和选项的信息,但看不到最终结果。不确定到底发生了什么。

这就是我所说的 VW6

我检查 vw6 运行良好。我使用简单的 php 脚本发送数据(为简洁起见,删除了调试行):

上面的打印 $result 什么也不打印。我在标准输出中看到的唯一东西是

在独立可执行模式下,如果我在没有 -daemon 选项的情况下使用相同型号的相同 dat 文件运行,它最后会很高兴地给出结果

知道守护程序模式会出现什么问题吗?我也尝试使用 -p /tmp/ 选项...使用 sudo 运行守护程序模式,但没有任何帮助。是否有调试转储选项或详细选项或其他东西来知道到底发生了什么?

谢谢

0 投票
1 回答
693 浏览

machine-learning - Vowpal Wabbit 可以处理大约 90 GB 的数据吗?

我们从搜索引擎查询日志数据中提取了特征,特征文件(根据 Vowpal Wabbit 的输入格式)达到 90.5 GB。这种巨大尺寸的原因是我们的特征构建中必要的冗余。Vowpal Wabbit 声称能够在几个小时内处理 TB 的数据。除此之外,大众使用几乎不占用 RAM 的哈希函数。但是,当我们使用 VW 对我们的数据运行逻辑回归时,几分钟之内,它就会耗尽所有 RAM,然后停止。这是我们使用的命令-

train_output 是我们要训练 VW 的输入文件,train.model 是训练后得到的预期模型

欢迎任何帮助!

0 投票
1 回答
1228 浏览

machine-learning - Vowpal Wabbit 中逻辑回归所需的参数是什么?

我正在使用以下参数

让 Vowpal Wabbit 了解我想应用逻辑回归是否是正确的方法?

0 投票
2 回答
1339 浏览

hadoop - 限制hadoop数据集中的文件(块)数量?

我有一个hadoop 数据集被分成太多数据块的问题。

  1. 给定一个已经存在的 hadoop 数据集,有没有办法将它的块组合成更少但更大的块?

  2. 有没有办法给pighadoop-streaming.jar(cloudera)他们将输出分成的块数上限?

0 投票
1 回答
197 浏览

ontology - 文档多标签分类 - 你从哪里获得标签?本体论?

我熟悉数据挖掘技术,但不太熟悉文本挖掘或 Web 挖掘。

这是一个简单的任务:将文章分类为一组类别。让我们假设,我提取了文章的文本内容并对其进行了处理。

您如何以及从何处获得类别 - 预定义标签?是否可以插入一个本体、分类法并根据需要进行细化?分类任务将是一个多标签分类。

在这种情况下,我们是否使用 n-gram 进行近似匹配?

目前我有从文本中提取的主题和命名实体。我可以为此使用 Vowpal Wabbit 吗?

0 投票
1 回答
648 浏览

vowpalwabbit - Vowpal Wabbit:让我在测试 59 时测试失败

make test出于某种原因,我在安装 ```Vowpal Wabbit``时遇到了该语句的问题。我收到以下错误:

任何人都知道这可能是什么?

0 投票
0 回答
334 浏览

machine-learning - 如何在 vowpal wabbit 上实现加权 SVD?

我正在尝试实现使用加权 SVD 的一类协作过滤 (OCCF) 算法。

我正在使用 Vowpal Wabbit 来实现正则化矩阵分解以在多类评级的情况下获得建议,但我不知道如何扩展 Vowpal Wabbit 矩阵分解来进行加权 SVD。

如何在 vowpal wabbit 上实现加权 SVD 或哪些其他软件已经实现了加权 SVD?

0 投票
1 回答
2388 浏览

machine-learning - 使用 Vowpal Wabbit 时计算 AUC

无论如何要在 Vowpal Wabbit 中计算 AUC 吗?

我使用 Vowpal Wabbit 的原因之一是数据文件很大。我可以使用 Vowpal Wabbit 的输出计算 Vowpal Wabbit 环境之外的 AUC,但如果数据文件很大,这可能会出现问题。

0 投票
1 回答
1361 浏览

vowpalwabbit - Vowpal Wabbit reverse_hash 选项产生空输出,但为什么呢?

我正在尝试使用倒置哈希保存一个 vowpal wabbit 模型。我有一个使用以下内容生成的有效模型:

vw --oaa 2 -b 24 -d mydata.vw --readable_model mymodel.readable

这会产生一个像这样的模型文件:

(等等成千上万的功能)。但是,为了更有用,我需要查看功能名称。似乎是一件相当明显的事情,但我做到了

vw --oaa 2 -b 24 -d mydata.vw --invert_hash mymodel.inverted

它产生了一个像这样的模型文件(不产生权重):

感觉好像我显然做错了什么,但我认为我正在以记录的方式使用这些选项:

--invert_hash类似于--readable_model,但模型以更易于阅读的格式输出,特征名称后跟权重,而不是哈希索引和权重。

有谁知道为什么我的第二个命令没有产生任何输出?

0 投票
0 回答
315 浏览

machine-learning - 有没有办法告诉 Vowpal Wabbit 忽略训练变量?

我以 vowpal wabbit 格式 (.vw) 创建了一个测试和训练集。我想探索删除各种变量的效果,但是我不想每次都从头开始重新生成我的火车组。有没有办法告诉大众只关注特定的输入或忽略特定的输入?

我知道我可以将命名空间与 --ignore 一起使用,但它似乎可以做我想做的事情,我必须为每个变量创建一个单独的命名空间。