我使用 VTune 来检查我的代码的并发性。这是输出的屏幕截图。您可以看到,有一些初始阶段有 1 个线程,然后是约 0.3 秒的密集多线程工作(棕色尖峰),然后是近 3 秒的空闲(没有棕色“CPU”,只有绿色“运行”)。
知道什么会导致线程处于绿色空闲状态吗?我的代码应该在完成所有密集计算后返回,没有理由再等待 3 秒......
我使用 VTune 来检查我的代码的并发性。这是输出的屏幕截图。您可以看到,有一些初始阶段有 1 个线程,然后是约 0.3 秒的密集多线程工作(棕色尖峰),然后是近 3 秒的空闲(没有棕色“CPU”,只有绿色“运行”)。
知道什么会导致线程处于绿色空闲状态吗?我的代码应该在完成所有密集计算后返回,没有理由再等待 3 秒......
如果没有分析器,您的程序需要多少时间才能执行?它更快吗?查看 VTune 的时间线视图,我的印象是主线程可能正在使用 pthread_exit() 退出 main() 函数,因此 OpenMP 工作线程继续存在,阻止程序完成,直到某个超时到期并且工作线程确实决定关闭自己。请参阅此处关于 pthread_exit 的讨论。