machine-learning - 我如何在 weka 中使用除 TF-IDF 之外的特征加权方法？

翻译自：https://stackoverflow.com/questions/21797930 2014-02-15T13:02:00.537

363 次

1）我想应用 IG、MI 等特征加权方法来加权我的特征，但 StringToWordVector 只允许我们使用 TF-IDf 来加权 weka 中的特征。

有没有一种方法可以应用除 TF-IDF 之外的加权方法来加权我的条款？

2）如何访问java代码中每个特征的TF-IDF权重？我调试了代码，发现所有术语都分配了权重 1.0 ？

 filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf-idf

3) IG 小于 0 的术语是否对分类过程没有帮助，我们应该始终将它们从词汇表中删除？

提前谢谢...

0 回答 0