2

我一直在努力进行这种分析,并在统计网站上发布了关于我是否朝着正确的方向前进,但在我一直在调查的过程中,我还发现我可爱的强大处理器(linux OS,i7 ) 实际上只使用其 1 个内核。原来这是默认行为,但我有一个相当大的数据集和 40 到 50 个变量可供选择。

检查各种不同模型的 stepAIC 函数似乎是并行化的理想选择,但我是 R 的相对新手,我对并行计算只有粗略的概念。

我查看了并行包和降雪包的文档,但这些似乎有一些用于并行化的内置列表函数,我不确定如何将 stepAIC 变形为可以并行运行的形式使用这些软件包。

有谁知道1)这是否是一个可行的练习,2)如何做我想做的事情,并且可以给我一种我需要的基本结构/关键字列表?

在此先感谢,斯蒂芬

4

1 回答 1

3

我认为一个步骤取决于 de last 的过程(如逐步选择)并行执行并非易事。

我知道的并行做某事的最简单方法是:

library(doMC)
registerDoMC()
l <- foreach(i=1:X) %dopar% { fun(...) }

在我对逐步的理解很差的情况下,提取模型的变量(或向前/向后添加)并测量每一步的拟合。例如,如果提取模型拟合的变量最好保留此模型。在 foreach 并行函数中,每个步骤都对其他步骤视而不见,也许您可​​以编写自己的函数来执行此任务,如

http://beckmw.wordpress.com/tag/stepwise-selection/

我寻找了这段代码,在我看来你可以使用 vif_func 函数的并行计算......

我认为您还应该检查优化的代码来完成该任务,如包中的跳跃

http://cran.r-project.org/web/packages/leaps/index.html

希望这可以帮助...

于 2013-05-20T17:18:16.007 回答