Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想在Weka中进行属性选择,但是我的数据集比较大,程序运行了很长时间。这就是为什么我想查看找到的当前最佳属性集。我该怎么做?例如,基因搜索有“报告频率”参数,但整个搜索完成后显示所有结果,这不是我需要的。
没有进度条,不知道还要等多久……
特征或属性选择是数据挖掘和机器学习领域的标准问题。
如果要选择一组好的属性,则必须通过根据属性的质量对属性进行排名来预处理数据。p-metric或t-statistic等排名方法很流行,它们基于统计测量。如果对属性的性质没有任何直觉,就不能简单地从一个大集合中随机选择属性。
如果您不需要在整个数据集上运行属性选择,您可以使用数据集的较小样本(只需编辑您的 ARFF 文件)来运行属性选择。