-1

我有一个问题,我试图在 python 中使用监督学习。我有一系列 x,y 坐标,我知道它们属于一个数据集中的标签。在另一个我只有x,y坐标。我将使用一组来训练另一组,我的方法是监督学习并使用分类算法(线性判别分析),因为标签的数量是离散的。尽管它们是离散的,但它们的数量很大(n=~80,000)。我的问题是,我应该在哪些标签数量上考虑回归而不是分类,其中回归更适合连续标签。我使用 SciKit 作为我的机器学习包,并使用 astronml.orgs 优秀教程作为指南。

4

1 回答 1

0

这与数字无关。这是关于是否连续。如果您有 80,000 个课程或更多课程,则无关紧要;只要相邻类之间没有相关性(例如类 i 和 i+1),就应该使用分类(而不是回归)。

回归仅在标签是连续的(例如实数)或至少在相邻类之间存在相关性时才有意义(例如,当标签显示某物的计数时,您可以进行回归然后将结果四舍五入) .

于 2016-05-01T13:05:30.230 回答