0

我有一个问题一直困扰着我。我可以用带标签的数据集(即:带有目标信息的数据集)训练神经网络,然后应用另一个没有标签的数据集吗?

我想用我拥有的示例训练网络,但在实际情况下希望它对示例进行分类(没有关联的目标)。例如:

训练集:

Var1  Var2  Var3  Var4  Target
1     2     3      1     blue

测试集 (没有目标,其实就是我想知道的)

Var1  Var2  Var3  Var4  
 1     2     3      1     

假设预测必须是蓝色的。

我正在使用快速矿工来测试神经网络,但我很快就明白我无法应用这个测试集,因为它错过了标签。

那我该如何解决我的问题呢?我想知道我是否需要针对这个问题探索无监督神经网络,但老实说我不这么认为。

亲切的问候。

4

2 回答 2

1

在没有标签的数据集上应用分类器(包括类似 mlp 的 nn)是分类器的实际使用。但是当你说test你的意思是你想看到质量衡量标准false alarm rateprecision,你需要标签来做到这一点。

假设您想训练一个分类器,然后在实际案例中使用它,我强烈建议您之前使用标记数据对其进行测试,并尝试使用具有最理想精度的模型。否则你可能会有大量的错误预测,这当然会打扰你。

如果您只有一个带有少量样本的标记数据集,您可以尝试k-fold验证。

于 2013-12-17T13:03:49.027 回答
1

对于监督学习,您使用标记的训练集来训练您拥有的任何模型。然后,您可以使用该模型来预测未标记集的标签。

如果您碰巧也有测试集的标签,您可以将预测值与测试集标签进行比较。这样您就可以评估预测误差(即测试模型,因此得名 - 测试集)

但是,如果您只对预测感兴趣,则绝对不需要标签。

于 2013-12-17T12:54:34.957 回答