3

我拥有 IPP 6,现在我检查已经有 IPP 8 可用。是否有任何基准可以比较最新 CPU 上的 IPP 6、7 和 8?特别是对于一维基本运算(mul、add、complex)、FFT 和 IIR 滤波。

4

1 回答 1

2

你可以自己做实验。IPP 提供有性能测量实用程序,通常是 ipp\tools\perfsys 目录中的“ps*.exe”。很难说在 IPP 6.x 的时候情况如何,但应该是类似的。“ps*.exe”可执行文件允许根据每个元素的时钟数(当然越低越好)来测量特定的 IPP 功能性能,以实现不同的 CPU 优化。这些性能的基本选项。测试是“-?”,“-e”显示测试中的所有函数,“-T”仅打开特定的 CPU 优化,“-r”将输出保存到 csv 文件中。

假设您要测量 AVX、SSE41 和 SSE3 CPU 的 ippsIIR64f_32s_Sfs 函数。需要启动 ps_ipps.exe(即 1D 域性能测试)3 次:

ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TAVX    (you'll get csv file with AVX optimization results)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE41  (SSE4.1 perf. data will be appended to csv)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE3"   (SSE3 performance data will be appended).

然后 grep csv 文件以获取所需的函数/参数组合,例如

find "ippsIIR64f,32s,Sfs,32768,6,numBq_DF1" ps_ipps.csv

例如,我得到

ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=2048,1.30,cpMac,512,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=8,1.56,cpMac,613,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=4,5.61,cpMac,2.21e+003,-

这意味着,SSE3 为 5.61 个时钟,SSE4.1 为 1.56 个时钟,AVX 为 1.30 个时钟。您的 CPU 必须支持您要测量的最高指令集。至于 IPP 7 和 8,您可以从英特尔网站下载英特尔产品(Composer 或 Parallel Studio)的“试用后购买”版本来进行基准测试。

于 2014-12-17T13:58:15.913 回答