我遇到了一个 SVM 示例,但我不明白。如果有人能解释预测的工作原理,我将不胜感激。请看下面的解释:
该数据集有10,000 个观测值,具有5 个属性(Sepal Width
、Sepal Length
、Petal Width
、Petal Length
、Label
)。标签positive
是否属于I.setosa
该类,negative
如果属于某个其他类。
有6000 个结果已知的观察值(即它们属于I.setosa
该类,因此它们的标签属性为正)。其余4000 个的标签未知,因此假定标签为负数。6000 个观察值和从剩余4000个中随机选择的2500个观察值形成了10 倍交叉验证的集合。然后使用 SVM(10 折交叉验证)对8500 个观测值进行机器学习,并绘制ROC 。
我们在这里预测哪里?该集合有6000 个观测值,其值是已知的。剩下的2500人是如何获得负面标签的?当使用 SVM 时,一些正面的观察得到负面的预测。这个预测对我来说没有任何意义。为什么排除这1500 个观察值。
我希望我的解释清楚。如果我没有清楚地解释任何事情,请告诉我。