我有一个程序,其基本结构如下:
<c language headers>
main() {
some malloc() allocations and file reads into these buffers
call to an assembly language routine that needs to be optimized to the maximum
write back the output of to files and do free()
exit()
}
汇编语言程序本质上是计算缓冲区中数据的校验和,我的目的是将其优化到绝对最大值。它不进行任何系统调用或任何库函数调用。
我刚刚将 Intel vTune Amplifier XE 套件安装到 VS 2015 中。
我如何指定 vtune 严格关注汇编语言例程部分,而跳过对“C”语言准备部分的所有分析。我似乎正在累积所有数据,例如指令计数或 CPI 等。是否可以仅获取汇编语言子例程中的循环和分支的数据。如果是这样,请告知我该怎么做。
谢谢