Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我稍微修改了 llvm (roc-1.6.x) 以生成可以在 AMDGPU pro 驱动程序上运行的代码。对于相同的 opencl 代码,它可以运行,但性能比 AMDGPU 的在线编译器慢 10% 以上。我想知道是否可以设置一些标志来调整 llvm。如果你能给我一些例子,那就太好了。