为解决这一特殊问题,英特尔® 线程构建模块库包含特殊结构。英特尔® TBB是有助于多线程编程的跨平台库。我们可以将您的应用程序中涉及的实体视为四个不同的任务提供程序。一种类型的任务是输入任务——那些提供输入数据的任务,另一种类型的任务由第一个操作例程提供,等等。
因此,用户唯一需要做的就是为这些任务提供主体。库中有几个 API 用于指定要处理的主体以及如何并行处理。其他一切(这里我的意思是线程创建、任务执行之间的同步、工作平衡等)都由库完成。
我想到的最简单的解决方案变体是使用parallel_pipeline函数。这是原型:
#include "tbb/pipeline.h"
using namespace tbb;
int main() {
parallel_pipeline(/*specify max number of bodies executed in parallel, e.g.*/16,
make_filter<void, input_data_type>(
filter::serial_in_order, // read data sequentially
[](flow_control& fc) -> input_data_type {
if ( /*check some stop condition: EOF, etc.*/ ) {
fc.stop();
return input_data_type(); // return dummy value
}
auto input_data = read_data();
return input_data;
}
) &
make_filter<input_data_type, manipulator1_output_type>(
filter::parallel, // process data in parallel by the first manipulator
[](input_data_type elem) -> manipulator1_output_type {
auto processed_elem = manipulator1::process(elem);
return processed_elem;
}
) &
make_filter<manipulator1_output_type, manipulator2_output_type>(
filter::parallel, // process data in parallel by the second manipulator
[](manipulator1_output_type elem) -> manipulator2_output_type {
auto processed_elem = manipulator2::process(elem);
return processed_elem;
}
) &
make_filter<manipulator2_output_type, void>(
filter::serial_in_order, // visualize frame by frame
[](manipulator2_output_type elem) {
visualize(elem);
}
)
);
return 0;
}
前提是实现了必要的功能(read_data、visualize)。这里input_data_type
,manipulator1_output_type
等是在流水线阶段之间传递的类型,操纵器的process
函数对传递的参数进行必要的计算。
顺便说一句,为避免使用锁和其他同步原语,您可以使用库中的 concurrent_bounded_queue 并将您的输入数据放入此队列中,通过可能不同的线程(例如专用于 IO 操作),就像简单一样concurrent_bounded_queue_instance.push(elem)
,然后通过读取它input_data_type elem; concurrent_bounded_queue_instance.pop(elem)
。请注意,弹出一个项目在这里是一个阻塞操作。concurrent_queue
提供非阻塞try_pop
替代方案。
另一种可能性是使用tbb::flow_graph
其节点来组织相同的流水线方案。看一下描述依赖关系和数据流图的两个示例。您可能需要使用sequencer_node来正确排序项目执行(如有必要)。
值得阅读tbb标签标记的 SO 问题,看看其他人如何使用这个库。