我正在尝试通过在 trainData 上对其进行训练然后在 testData 上进行测试来使用神经网络,就像任何人都会做的那样。但是,数据需要将一些标称特征虚拟编码为数字。当我这样做时,它会训练神经网络,但在将其应用于测试数据(我在其上应用完全相同的转换/块)时失败,因为虚拟编码*不匹配。
*错误信息在以下行中:v47=H 在 testData 中不存在
我检查了一下,确实 testData 在 v47 中根本没有值“H”,而 trainData 有它。因此,我想在 v47 中忽略这个“H”,或者替换它。
有什么办法可以轻松做到这一点?请记住,其他功能也可能会发生这种情况,并逐个检查所有功能来解决此类问题,这将非常耗时。
也许还有另一种方法可以解决这个问题?
谢谢!