1

我有一个分类问题,为了解决这个问题,我打算使用不同的特征集,比如 unigramms 和 bigramms,也许会更晚一些。我想尝试这些功能集的不同组合。最好的方法是什么?我是否必须为不同的功能集组合准备不同的文件?

4

1 回答 1

1

一种简单的方法是使用“RemoveByName”过滤器,根据正则表达式过滤掉属性。因此,例如,如果 unigram 特征名称以“uni_”开头,而 bigrams 以“bi_”开头,则可以使用 RemoveByName -E ^uni_ 仅保留 bigram。您可以通过 GUI 作为预处理步骤或使用元“FilteredClassifier”来执行此操作。

但是,我想不出在 WEKA 中尝试不同组合的自动化方式。

于 2013-03-12T11:17:57.167 回答