1

我正在尝试对 vowpal 中的样本数据运行逻辑回归。我创建了一个示例数据集,如下所示:

 1 1.0  | a:3.28 b:1.5 c:2.0  |example
-1 1.0  | a:1.25 b:0.4 c:1.4  |example
 1 1.0  | a:1.40 b:0.8 c:1.6  |example
 1 1.0  | a:2.00 b:4.2 c:2.1  |example
-1 1.0  | a:2.51 b:2.7 c:1.9  |example
 1 1.0  | a:1.72 b:2.3 c:0.6  |exampleone
 1 1.0  | a:1.81 b:2.1 c:0.9  |example

当我尝试运行逻辑时,它显示错误“您使用的是损失函数专家或格式错误示例指定的标签 0 而不是 -1 或 1”

在此之后,我想计算最后的分数以及如何在 vowpal 中计算分数或 auc 曲线

4

1 回答 1

2

确保为Vowpal Wabbit使用正确的输入数据格式

--loss_function=logistic如果您使用(或) 并且您的某些示例具有标签 0,则会出现错误“您正在使用标签 0”。--loss_function=hinge我无法使用您提供的示例重现该错误。

示例中的 " |example" 被解释为没有功能的命名空间,这可能不是您想要的。“1.0”被解释为示例重要性权重,但 1.0 是默认重要性权重,因此您可以省略它。如果要使用标签,它们必须在第一个竖线之前(竖线之前没有任何空格)。因此示例应如下所示:

1 tag1| a:3.28 b:1.5 c:2.0 -1 tag2| a:1.25 b:0.4 c:1.4 1 tag3| a:1.40 b:0.8 c:1.6 1 tag4| a:2.00 b:4.2 c:2.1 -1 tag5| a:2.51 b:2.7 c:1.9 1 tag6| a:1.72 b:2.3 c:0.6 1 tag7| a:1.81 b:2.1 c:0.9

最后计算分数以及如何计算分数或auc

什么分数?VW 计算渐进式验证损失(如果您使用多次传递而不使用 ,则为保持损失--holdout_off)。如果你想计算ROC 曲线下的面积,你必须使用一些外部工具,例如perf。请参阅使用 Vowpal Wabbit 时计算 AUC

于 2015-05-27T20:36:53.640 回答