1)如何在weka中应用LSI等特征减少方法进行文本分类?
2)应用LSI等特征减少方法可以提高分类的准确性吗?
查看FilteredClassifier类或AttributeSelectedClassifier。使用 FilteredClassifier,您可以使用诸如主成分分析 (PCA) 之类的特征减少方法。这是一个如何使用 PCA 过滤数据集的视频,以便您可以在缩减数据集上尝试不同的分类器。
它可以提供帮助,但不能保证这一点。如果您删除冗余特征,或以某种方式转换特征(如 SVM 或 PCA),分类任务会变得更简单。无论如何,大量的特征通常会导致维度灾难,而属性选择是避免它的一种方法。