3

我有一个特征集列表(40 个特征),我的想法首先是评估我能得到的所有组合的分类器。然而,经过我的计算,我发现组合将达到数百万!因此,它将永远存在!!!!

我读到了使用随机搜索方法选择随机特征的能力。但是,每次我运行随机搜索时,我都会得到相同的功能集。我需要更改种子编号或任何选项吗?

另外,使用随机搜索是否有效并且可以替代选择所有组合的方法???

我将感谢您的帮助专家。

提前谢谢了,

艾哈迈德

4

1 回答 1

4

当你想在 WEKA 中进行属性选择时,你应该考虑到 2 种算法,搜索器和属性评估器(我稍后会谈到)。

正如你所说,也许你不能尝试一个,Exhaustive search因为它需要很长时间,有一些贪婪的替代方案可以获得好的结果(取决于问题),比如Best first(基于hill climbing)。您评论的选项 ( Random search) 是另一种制作选择子集的方法,它会进行随机迭代以选择将被评估的子集。

为什么你得到相同的选定属性子集?因为Random search总是选择相同的子集,并且评估者确定最好的子集(最终输出)。但是,如果我更改seed参数,它应该会更改。也许或者……也许不是。为什么?因为如果算法执行足够次数的迭代(尽管它从不同的种子开始),它将获得与前一个相同的子集(收敛),并且评估者将选择与前一次执行相同的子集。

如果您不想在选择器输出中获得收敛,只需更改seed,但选择较小search percent的以限制探索并获得不同的结果。

但是,在我看来,如果你总是得到相同的结果是因为评估者(我不知道你使用的是什么算法)已经确定这个子集是给定数据集的“最好的”。我还建议您尝试使用其他选择器,例如Best first或 aGenetic search作为您的搜索方法。

于 2013-01-29T07:28:23.847 回答