我正在使用 FFTW(一个 FFT 库)的线程版本来尝试加速双 CPU 机器上的一些代码。这是只有 1 个线程的时间输出:
131.838u 1.979s 2:13.91 99.9%
这里有 2 个线程:
166.261u 30.392s 1:52.67 174.5%
用户时间和 CPU 负载百分比似乎表明它的线程非常有效,但是挂钟时间(这是我真正关心的)告诉我(我认为)处理线程需要大约 28 秒的额外时间. 这是描述情况的准确方式吗?如果是这样,这是相当正常的,还是我可能配置不正确?谢谢你的光。