我有大量数据,想要调用缓慢但干净的方法,而不是调用对第一个结果有副作用的快速方法。我对中间结果不感兴趣,所以我不想收集它们。
明显的解决方案是创建并行流,进行慢速调用,再次使流顺序,并进行快速调用。问题是,所有代码都在单线程中执行,没有实际的并行性。
示例代码:
@Test
public void testParallelStream() throws ExecutionException, InterruptedException
{
ForkJoinPool forkJoinPool = new ForkJoinPool(Runtime.getRuntime().availableProcessors() * 2);
Set<String> threads = forkJoinPool.submit(()-> new Random().ints(100).boxed()
.parallel()
.map(this::slowOperation)
.sequential()
.map(Function.identity())//some fast operation, but must be in single thread
.collect(Collectors.toSet())
).get();
System.out.println(threads);
Assert.assertEquals(Runtime.getRuntime().availableProcessors() * 2, threads.size());
}
private String slowOperation(int value)
{
try
{
Thread.sleep(100);
}
catch (InterruptedException e)
{
e.printStackTrace();
}
return Thread.currentThread().getName();
}
如果我删除sequential
,代码按预期执行,但显然,非并行操作将在多个线程中调用。
你能推荐一些关于这种行为的参考,或者一些避免临时收集的方法吗?