我想知道我可以将arff文件中的问号替换为“0”吗?有什么区别吗?下面的一个例子:
@数据
4.4,?,1.5,?,鸢尾花
这是个很大的差异。 问号告诉您正在使用的任何算法都缺少该值。用零替换它表示该值实际上是零。
一些方法能够处理缺失值。这些方法可以用该属性的其他值的平均值替换缺失值,它们可能完全忽略该实例,或者它们可能做其他事情。但是,如果您告诉方法该值为零(实际上并非如此),那么您就是在指定缺失值会发生什么,它们被假定为零。
此链接提供了“.arff”文件的非常详细的描述,以及它们的预期内容。