是否有可用于使用 Halide 语言编写的代码的性能计数器?我想知道我的代码执行了多少加载、存储和 ALU 操作。
用于调度多阶段管道的 Halide 教程通过比较分配的内存量、加载、存储和对 halide Funcs 的调用来比较不同的调度,但我看不到这些信息是如何收集的。我想每次发生这些操作之一时,都可以使用 trace_stores、trace_loads 和 trace_realizations 打印到控制台。虽然这不是一个很好的选择,因为它会大大减慢程序的执行速度,并且需要某种计数脚本来将控制台输出的长列表编译为加载、存储和 ALU 操作所需的计数。