我在具有许多属性的巨大数据集上使用 weka。那么是否有可能自动应用特征选择的输出?无需手动删除数百个特征?(在资源管理器中)
如果有人知道,这将是一个加号:CLI 的命令是什么?(我经常使用脚本来处理大量的数据/分类器)
非常感谢!
我在具有许多属性的巨大数据集上使用 weka。那么是否有可能自动应用特征选择的输出?无需手动删除数百个特征?(在资源管理器中)
如果有人知道,这将是一个加号:CLI 的命令是什么?(我经常使用脚本来处理大量的数据/分类器)
非常感谢!
这在 Explorer 和 CLI 中是完全可能的。
在 Preprocess 选项卡上的资源管理器中,有一个标记为 Filter 的框。如果您选择选择按钮,并在新窗口中展开一些文件夹,您将找到受监督和不受监督的属性过滤器。选择适当的过滤器后,您的选择将出现在“预处理过滤器”框中。您可以双击此框以显示一个窗口,其中包含允许您进一步定义过滤器的选项。此窗口还将包含名为“更多”和“功能”的按钮,可让您了解有关所选过滤器的更多信息。
对于您的任务,一些好的过滤器可能是:
过滤器 > 监督 > 属性 > AttributeSelction
这是一种应用一些内置 Weka 属性选择程序的方法。
过滤器>无监督>属性>删除
这将允许您提供要从数据集中删除的属性的索引。
要在 CLI 中实现这些属性过滤器和其他过滤器,我建议查看这两个来源。他们的解释工作比我希望做的要好。