Nvidia Visual Profiler 建议我尝试使用 maxregcount 标志进行编译。Alea GPU 中是否有任何等价物以及它是如何使用的?
我正在使用 JIT 编译,并找到了 JITMaxRegisters 选项,但它似乎对每个线程的寄存器计数没有影响。
{ worker.DefaultCompileOptions.ToProfilingConfig ()
with JITMaxRegisters = Some 60;
MinimalArch = DeviceArch.Create("sm35")}
使用此编译选项,可视化分析器仍显示正在使用 72 个寄存器/线程。
是否有任何等效于我缺少的 maxregcount 或 __launch_bounds__ ?