1

为了练习,我决定使用神经网络来解决ACM 知识发现和数据挖掘特别兴趣小组在 2009 年杯赛上提出的分类问题(2 类) 。我发现的问题是数据集包含很多“空”变量,我不知道如何处理它们。此外出现了第二个问题。如何处理其他非小数,如字符串。您的最佳实践是什么?

4

1 回答 1

1

大多数方法都需要数字特征,因此必须将分类特征转换为计数。例如,如果某个实例的属性中存在某个字符串,则其计数为1,否则为0。如果多次出现,则计数相应增加。从这个角度来看,任何不存在的功能(或您所说的“空”)的计数为 0。请注意,属性名称必须是唯一的。

于 2012-10-11T11:10:09.007 回答