6

我正在尝试在 Weka 中执行属性选择。我想用 InfoGainAttributeEval 作为评估器,因为我读到它相当于互信息,而 Ranker 作为搜索方法。我应该对训练集和测试集执行属性选择吗?另外,如何为 N 参数选择正确的值?

非常感谢您的时间,

纳迪亚

4

1 回答 1

1

在训练和测试上分别应用属性选择可能会导致选择不同的属性,从而使它们不兼容。因此,要确保两个集合具有相同的属性,您需要在整个数据集上应用属性选择。一旦您选择了最有用的属性,您就可以将数据拆分为训练集和测试集。

至于使用哪个值-N,我会使用您的属性总数。这将生成所有属性的排名列表,您可以自己评估所有属性的不同分数。然后,您可能会发现一个明确的阈值,将包含任何有用信息的属性与不添加任何内容的属性分开来训练分类器。然后,我将使用该-T选项设置此阈值。

于 2012-09-17T13:48:45.580 回答