我最近接触了车顶线模型,我对它还很陌生。
我正在尝试为 Intel Xeon W-2133 构建一个,但用于单核和单线程应用程序
根据此处,英特尔至强 W-2133 的峰值 GFLOPS 为537.6 GFLOPS。据我了解,因为我正在使用单核单线程应用程序,W-2133 有 6 个内核[每个内核 2 个线程],峰值触发器应该下降到 537.6/12=44.75 GFLOPS
此处显示的至强 W-2133 的内存带宽为85.3 GB/s
机器平衡(水平线与对角线的交点)是否应该是:44.75/85.3 = 0.52 flops/byte?
我有以下问题:
- 我的假设对于单核单线程峰值触发器是否正确?
- 我的方法计算机器平衡是否正确?
考虑到内核的 AI,我计划使用此模型将其他内核分类为内存绑定/计算绑定。
这是使用屋顶线模型对内核进行分类的正确方法吗?
任何帮助将不胜感激。