我正在使用 Intel Advisor 2020 进行一些实验,尤其是使用车顶线模型。我不太明白的是为什么峰值标量整数性能(intop/cycle)与我期望的理论值不同,特别是因为所有其他指标或多或少都匹配(向量整数性能,浮点......)
特别是根据 Intel Advisor,最大峰值性能(对于加法)约为每个周期 2.3 个整数运算,而我希望找到的理论值是 4 个 intop/周期,因为我们在 4 个不同的端口中有 4 个 INT ALU。
我错过了什么吗?
我正在使用 Intel Advisor 2020 进行一些实验,尤其是使用车顶线模型。我不太明白的是为什么峰值标量整数性能(intop/cycle)与我期望的理论值不同,特别是因为所有其他指标或多或少都匹配(向量整数性能,浮点......)
特别是根据 Intel Advisor,最大峰值性能(对于加法)约为每个周期 2.3 个整数运算,而我希望找到的理论值是 4 个 intop/周期,因为我们在 4 个不同的端口中有 4 个 INT ALU。
我错过了什么吗?