假设我有一个并行算法,它使用带有一个或两个锁的显式线程进行同步,并且经过优化以利用缓存线(包括多核之间的共享 L3 缓存),将其合并到 TBB 程序中的好方法是什么?有问题的算法不像它分解成线程那样很好地分解成任务。
问问题
87 次
假设我有一个并行算法,它使用带有一个或两个锁的显式线程进行同步,并且经过优化以利用缓存线(包括多核之间的共享 L3 缓存),将其合并到 TBB 程序中的好方法是什么?有问题的算法不像它分解成线程那样很好地分解成任务。