0

我正在尝试使用 SVC 对看不见的测试数据预测测试数据的结果,即目标变量是我必须预测的。现在,对于作为目标变量的训练数据,我对训练数据进行了概率编码,因为 city 列中的城市数量为 100+,所以我选择了概率编码,因为 one-hot 编码会增加数据的维度. 现在我被困在如何对不存在目标变量的测试数据中的城市进行编码,我应该使用为训练数据中的城市计算的相同概率还是有其他方法可以做到这一点?这是训练数据中城市的概率编码快照:

在此处输入图像描述

4

0 回答 0