我无法在 NVIDIA Visual Profiler 的时间线上隔离我的代码的关键部分。一些巨大的酒吧,如图像中的那个。
我对优化这个函数不感兴趣,它在时间线上的存在会破坏程序中的几个统计测量。因此,我想告诉分析器忽略它。是否可以?
您可以在开发周期的不同点使用不同的技术修改分析范围:
编写代码时,您可以使用CUDA 分析器 API来启动和停止分析活动。如果您使用此方法,当实际运行分析器来捕获数据时,您可能希望从关闭分析开始(与默认值相反),然后在代码中的特定点打开分析。在视觉分析器中,您可以在初始对话框中选择一个复选框来执行此操作。 nvprof
有一个命令行开关来修改启动分析行为。
大部分独立于上述第 1 项,您可以在运行分析器以捕获数据时修改分析器捕获的数据。例如, 使用nvprof ,您可以按名称选择特定内核进行配置。
也许最直接与您的问题有关,在探查器数据的可视化点上,可视化探查器在File...New Session对话框中有一个Timeline Options 选项卡,如果您正在导入会话,例如 from ,它也可用过滤实际显示的数据。可以按捕获时间和数据类型过滤数据,例如:nvprof