我有一个由预处理方法名称组成的数据框。
*Impute* *Scale*
naomit noscale
knnimpute noscale
naomit scale
knnimpute scale
在第一步中,函数 g() 逐行执行方法以创建预处理数据集。对于第一行:identity(na.omit(data))
在第二步中,计算每个预处理数据集的分类误差。目标是找到一个最小化分类错误的组合。
有成千上万种组合。目前,我使用全盲或简单的网格搜索。我需要一种更智能的方法来找到值得测试的预处理数据集。
我知道有用于优化的 CRAN 任务视图,并且我试图从这里(http://dl.acm.org/citation.cfm?id=937505)学习概念问题。
什么是一个好的 R 组合优化包/功能,可以通过最少的前期工作更快地找到近似最佳的解决方案?