由于 C++11 没有future.then
我已经concurrency::task
从 MicrosoftPPL
库开始使用。它大部分时间都很好用。
但是,现在我处于使用 GPGPU 的情况,因此在调度程序中PPL
安排 .then 延续会导致 GPU 空闲时出现不必要的延迟。
我的问题是是否有任何可能的解决方法concurrency::task
并concurrency::task::then
让它们直接执行。
据我了解,由于缓存效率的原因,在大多数情况下,定期安排的任务会立即继续执行。但是,对于从显式线程(即 GPU 线程)使用concurrency::task_completion_event
.
我正在做的一个例子:
template<typename F>
auto execute(F f) -> concurrency::task<decltype(f())>
{
concurrency::task_completion_event<decltype(f())> e;
gpu_execution_queue_.push([=]
{
try
{
e.set(copy(f())); // Skipped meta-template programming for void.
}
catch(...)
{
e.set_exception(std::current_exception());
}
});
// Any continuation will be delayed since it will first be
// enqueued into the task-scheduler.
return concurrency::task<decltype(f())>(std::move(e));
}
void foo()
{
std::vector<char> data /* = ... */;
execute([=]() -> texture
{
return copy(data)
})
.then(concurrency::task<texture> t)
{
return execute([=]
{
render(t.get());
});
})
.get();
}