我似乎无法找出预处理选项卡中的属性选择过滤器的作用?有人可以用简单的语言告诉我,因为我是 weka 的新手
当我将它应用到我的数据集时,它似乎删除了几个属性,但我不确定为什么
一个真实的数据集可能包含许多属性。在这个数据集上应用任何数据挖掘过程(例如寻找集群、生成分类模型......)可能需要很长时间。
取而代之的是,我们可以选择一些称为 的属性(维度)the most discriminative attributes
。这些属性几乎可以描述具有较少属性的数据集,这将加快对数据进行的任何处理。
属性选择选项卡包含许多用于选择这些属性的不同方法。其中之一是CFS 特征集评估此过滤器为您提供与类标签具有更高相关性的属性,这使它们成为区分属性。