3

我稍微修改了 llvm (roc-1.6.x) 以生成可以在 AMDGPU pro 驱动程序上运行的代码。对于相同的 opencl 代码,它可以运行,但性能比 AMDGPU 的在线编译器慢 10% 以上。我想知道是否可以设置一些标志来调整 llvm。如果你能给我一些例子,那就太好了。

4

0 回答 0