我刚刚开始熟悉 R 中的并行性。
当我计划在我的项目中使用Microsoft Azure 机器学习工作室时,我已经开始研究Microsoft R Open为并行提供了什么,因此,我发现了这个,它说并行是在引擎盖下完成的,它利用了所有可用内核,无需更改 R 代码。本文还展示了一些性能基准,但是,它们中的大多数都展示了进行数学运算的性能优势。
到目前为止这很好。此外,我也有兴趣知道它是否也并行化*apply
引擎盖下的功能。我还发现了这 2 篇文章,它们通常描述了如何并行化*apply
函数:
- 使用雪的并行 R 快速指南:描述使用
snow
包、par*apply
函数族和clusterExport
. - R 中并行计算的简要介绍:使用
parallel
包、par*apply
函数族和绑定值到环境。
所以我的问题是什么时候我将*apply
在 Microsoft Azure Machine Learning Studio 中使用函数,默认情况下会在后台并行化,还是我需要使用诸如 之类的parallel
包snow
?