当数据仅包含在一个列表或矩阵中时,雪包 parXapply() 函数可以很好地分配工作,但在这种情况下,我需要在四种不同类型的矩阵上运行一个函数。
例如,这就是我现在所拥有的:
res.list = parLapply(cl, mynames, myfun, listA, listB, listC, listD)
myfun = function(name, listA, listB, listC, listD) {
matrixA = listA[[name]]
matrixB = listB[[name]]
matrixC = listC[[name]]
matrixD = listD[[name]]
}
我遇到的问题是矩阵非常大,我怀疑在完整列表上调用 parLapply() 涉及将所有数据传输到每个集群节点。这可能非常耗时并且会降低集群性能。
如何在调用 myfun() 之前拆分列表并仅将相关矩阵发送到每个节点进行处理?