我有一个令人尴尬的并行问题,我正在使用snowfall包及其函数sfLapply处理该问题。它很好用,只是我需要一种更好的方法来解决我的问题。我传入的数据框如下所示:
Group Date
1 02/01/12
4 02/01/12
... ...(31 items)
13 02/01/13
4 02/18/13
5 02/18/13
... ...(9 items)
22 02/18/13
并且需要按日期分成处理组。麻烦的是,只有大约 5 个不同的日期,所以只使用
split(processing.groups, processing.groups$date)
导致并行作业太少。我想要的是一种获取列表的优雅方式,其中每个列表元素包含不超过 20 个条目,但保证它们都具有相同的日期。
例子:
List Elem 1: 20 items
1 02/01/12
4 02/01/12
... ...
9 02/01/12
List Elem 2: 14 items
99 02/01/12
17 02/01/12
... ...
13 02/01/12
List Elem 3: 11 items
4 02/18/13
5 02/18/13
... ...
22 02/18/13
感觉就像一些棘手的 listy cutty splitty 语法应该能够巧妙地实现这一点。有什么建议么?