1

Nvidia Visual Profiler 建议我尝试使用 maxregcount 标志进行编译。Alea GPU 中是否有任何等价物以及它是如何使用的?

我正在使用 JIT 编译,并找到了 JITMaxRegisters 选项,但它似乎对每个线程的寄存器计数没有影响。

{ worker.DefaultCompileOptions.ToProfilingConfig () 
   with JITMaxRegisters = Some 60; 
        MinimalArch = DeviceArch.Create("sm35")}

使用此编译选项,可视化分析器仍显示正在使用 72 个寄存器/线程。

是否有任何等效于我缺少的 maxregcount 或 __launch_bounds__ ?

4

0 回答 0