1

我在 xeon phi 内核上运行 vtune,并在单线程基准测试中获得了 0.777 的 CPI。然而,这似乎不太可能是真的,因为理论上单个线程的最大 CPI 是 1.0。(在https://software.intel.com/en-us/articles/optimization-and-performance-tuning-for-intel-xeon-phi-coprocessors-part-2-understanding上搜索“理论 CPI” )

我通过检查 vtune 线程信息验证了没有其他线程正在运行。

  1. VTune CPI 信息:

函数/调用堆栈 Clockticks 指令 已停用 CPI 速率 停用 错误推测 后端绑定 前端绑定模块 函数(完整) 源文件起始地址 centered_3d 259,622,095,647 334,057,786,295 0.777 0.316 0.000 0.719 0.004 ef-test centered_3d ef_operator.c 0x

从以上信息来看,CPI为0.777。

  1. 函数 centered_3d 的 VTune 线程信息:

239.616s -- 同时使用的逻辑 CPU = 0

163.632s -- 同时使用的逻辑 CPU = 1

以上信息是否暗示 vtune 的某些计算不正确?例如:它是否可能没有正确计算周期数或指令数?

4

0 回答 0