3

我已经学习了几天的逻辑回归,我认为逻辑回归的数据集的标签需要为 1 或 0,对吗?

但是当我查找libSVM库的回归数据集时,我看到标签值是连续数字(例如 1.0086,1.0089 ...),我错过了什么吗?

请注意,libSVM 库可用于回归问题。

非常感谢 !

4

3 回答 3

3

与其名称相反,逻辑回归是一种分类算法,它输出以数据点为条件的类概率。因此,训练集标签需要为 0 或 1。对于您提到的数据集,逻辑回归不是合适的算法。

SVM 是一种分类算法,它使用输入标签 -1 或 1。它不是概率算法,它不输出类概率。它也可以适应回归。

于 2013-01-19T17:49:16.370 回答
0

您是在使用 3rd 方库还是自己编程?通常,标签用作基本事实,因此您可以看到您的方法有多有效。

例如,如果您的算法试图预测某个特定实例是什么,它可能会输出 -1,那么基本事实标签将为 +1,这意味着您没有成功分类该特定实例。

于 2013-01-19T14:22:30.430 回答
0

请注意,“回归”是一个通用术语。说某人将执行回归分析并不一定会告诉您他们将使用什么算法,也不一定告诉您数据集的所有性质。它真正告诉您的是,您有一组样本,这些样本具有您想要用来预测单个结果值的特征(条件概率模型)。

逻辑回归和线性回归之间的一个主要区别是前者通常在分类的、二进制标记的样本集上进行训练。而后者是在真实标记的(ℝ)样本集上训练的。

任何时候你的标签是真正的价值,这意味着你可能会使用线性回归或类似的,或者如果你想实际上使用逻辑回归,则将那些真正的价值标签转换为分类标签(例如通过阈值或箱) 。但是,如果您尝试从一种此类问题设置转换为另一种设置,则结果的质量和解释可能存在很大差异。

另请参见回归分析

于 2013-01-20T04:11:37.447 回答