问题标签 [intel-vtune]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
architecture - Xeon Phi 上的 vtune 中可能存在错误
我在 xeon phi 内核上运行 vtune,并在单线程基准测试中获得了 0.777 的 CPI。然而,这似乎不太可能是真的,因为理论上单个线程的最大 CPI 是 1.0。(在https://software.intel.com/en-us/articles/optimization-and-performance-tuning-for-intel-xeon-phi-coprocessors-part-2-understanding上搜索“理论 CPI” )
我通过检查 vtune 线程信息验证了没有其他线程正在运行。
- VTune CPI 信息:
函数/调用堆栈 Clockticks 指令 已停用 CPI 速率 停用 错误推测 后端绑定 前端绑定模块 函数(完整) 源文件起始地址 centered_3d 259,622,095,647 334,057,786,295 0.777 0.316 0.000 0.719 0.004 ef-test centered_3d ef_operator.c 0x
从以上信息来看,CPI为0.777。
- 函数 centered_3d 的 VTune 线程信息:
239.616s -- 同时使用的逻辑 CPU = 0
163.632s -- 同时使用的逻辑 CPU = 1
以上信息是否暗示 vtune 的某些计算不正确?例如:它是否可能没有正确计算周期数或指令数?
directshow - 使用英特尔 Vtune 放大器进行分析
我已经使用一些静态库创建了一个过滤器 dll,这个 dll 用于图形工作室并且运行良好。但是我必须对我的 dll 进行分析,所以我已经启动了 graph studio 然后是 vtune。在 vtune 项目属性中,我已将其附加到进程并成功生成了 Profile 报告。但我只能看到我的代码汇编,而不是我的代码的 c/c++ 源代码。如何在 Vtune 中查看我的 dll 的源代码?
performance - Vtune 仅获取摘要信息
我使用 Intel Vtune 在 Xeon Phi 上分析代码。我使用以下命令:
amplxe-cl -collect knc-general-exploration ./a.out
结果是一堆信息以及一个包含更多信息的新目录。我只对一个指标感兴趣(比如 CPI)。我不希望 Vtune 创建包含大量其他信息的目录。
是否有命令行选项可以说just print the summary
linux-kernel - 系统分析 - 共享库的使用信息
有没有办法知道在一段时间内哪个进程(或多少个进程)正在使用哪些库文件。
可以为此使用 V-Tune 或 perf 或 OProfile 吗?
c++ - 如何使用 vtune 分析加法、乘法等的数量
我可以使用“INST_RETIRED.ANY”事件通过 Vtune 分析我的 C++ 库的指令计数。
根据整数/浮点加法、乘法、除法等的数量,可以使用哪些分析类型或事件?
assembly - 如何将 Vtune 分析限制为特定功能
我有一个程序,其基本结构如下:
汇编语言程序本质上是计算缓冲区中数据的校验和,我的目的是将其优化到绝对最大值。它不进行任何系统调用或任何库函数调用。
我刚刚将 Intel vTune Amplifier XE 套件安装到 VS 2015 中。
我如何指定 vtune 严格关注汇编语言例程部分,而跳过对“C”语言准备部分的所有分析。我似乎正在累积所有数据,例如指令计数或 CPI 等。是否可以仅获取汇编语言子例程中的循环和分支的数据。如果是这样,请告知我该怎么做。
谢谢
floating-point - 如何解释 FP_COMP_OPS_EXE.X87 等操作名称
我使用 Intel VTuen 来收集程序的指令,我得到的结果如下
在每种运算的名称中,我知道“FP”代表浮点,“OPS”代表运算,但“COMP”代表什么?我最初的理解是“COMP”是比较的意思,是这样吗?如果是,那么这里的比较是什么意思?
c++ - intel Vtune 的整数加减法事件计数在哪里?
我正在使用英特尔 VTune 来分析我的程序。
我使用的 CPU 是 IVY Bridge。
所有硬件指令事件都可以在这里找到:
https://software.intel.com/en-us/node/589933
FP_COMP_OPS_EXE.X87 本周期执行的 FP 计算 Uop 数。FADD、FSUB、FCOM、FMUL、整数 MUL 和 IMUL、FDIV、FPREM、FSQRTS、整数 DIV 和 IDIV 的数量。此事件不区分超验流中间使用的 FADD 和 s
FP_COMP_OPS_EXE.X87 似乎包括整数乘法和整数除法;但是,那里没有整数加法和整数减法。我在上面的网站上也找不到这两种指令。
谁能告诉我计算整数加法和整数减法指令的事件是什么?
c++ - 基于挂钟时间和英特尔 Vtune 放大器的 Profile C++ 程序
我刚刚开始使用英特尔 VTune Amplifier XE,默认情况下看起来只有 CPU 时间测量。是否可以设置 VTune 以根据挂钟时间(实时)获得结果?实际上我的目标是从磁盘 I/O 操作中获取热点。