我正在运行基于 FFTW3 库的 PyFFTW 包装器的代码。在 PyFFTW 的计划函数调用中,有一个参数“thread”来指定要使用的线程数。我使用一个基本判断,活动监视器来判断多线程是否有效。事实证明,即使我指定 thread=4,以下代码也可以在一个 CPU 上运行。我的笔记本电脑是 8 核的 Mac。这是我的代码。
import pyfftw
n_cpu = 4
flags = ('FFTW_MEASURE','FFTW_DESTROY_INPUT')
x_buffer = pyfftw.n_byte_align_empty((8192,8192,), 16, 'complex128')
f_buffer = pyfftw.n_byte_align_empty((8192,8192,), 16, 'complex128')
fftObj = pyfftw.FFTW(x_buffer, f_buffer, axes=(-2,-1), direction='FFTW_FORWARD', flags=flags, thread=n_cpu)
fftObj()
当我运行 fftObj() 时,计算机似乎在一个 CPU 上运行(CPU 使用率为 99%,而预期应为 400%)。我想要的是让 FFT 任务分布在我的笔记本电脑的 CPU 之间。
除了尝试 pyfftw 之外,我还尝试使用 OpenMP 用 C 语言编写一些其他代码,我从活动监视器中看到 CPU 使用率高于 100%。这意味着 C 代码在多个 CPU 上运行,而我的机器确实具有多核功能。
打开 pyfftw 的多线程有什么我错过的吗?还是我误解了参数的含义?
有一个相关的问题。